2017-01-22 79 views
0

我们将有近50亿个文档来索引ES5.x。我没有找到关于字段名称压缩的信息。ElasticSearch 5字段名称压缩

我们在以前的系统中使用“ca”而不是“created_at”来节省空间。

我们是否需要在ES5.x中保持字段名称更小或者它已经以某种方式被压缩了?

Thx

+0

我会惊讶地听到字段名称存储在每个文件的全部。如果每个文档中都有一个新字段,这可能是有意义的(如果完全支持),但如果所有文档具有相同的映射类型,则不需要优化字段名称。 – Harald

回答

1

你有一个MongoDB背景吗?(这曾经是一个问题)?

Quoting Lucene的核心贡献者之一,因为存储是Lucene的工作:

有每段单个文件(* .fnm)能解决场 名称为整数ID,那么剩下的的索引使用这些整数 ID。所以只有那个包含每个字段的字符串名称 的副本的文件将会更大。

因此缩短字段名称的效果将是最小的。然而,取决于您的映射,Elasticsearch中的存储可能比JSON源更小或更大,但这取决于映射以及您的数据的可能性如何。compressed in Elasticsearch

+0

是的..我们有WWIII机智mongodb :)如果ES缩短字段名称那太棒了。谢谢.. – Prometheus