ElasticSearch 5字段名称压缩

我们将有近50亿个文档来索引ES5.x。我没有找到关于字段名称压缩的信息。ElasticSearch 5字段名称压缩

我们在以前的系统中使用“ca”而不是“created_at”来节省空间。

我们是否需要在ES5.x中保持字段名称更小或者它已经以某种方式被压缩了？

Thx

2017-01-22 Prometheus

我会惊讶地听到字段名称存储在每个文件的全部。如果每个文档中都有一个新字段，这可能是有意义的（如果完全支持），但如果所有文档具有相同的映射类型，则不需要优化字段名称。 – Harald

你有一个MongoDB背景吗？（这曾经是一个问题）？

Quoting Lucene的核心贡献者之一，因为存储是Lucene的工作：

有每段单个文件（* .fnm）能解决场名称为整数ID，那么剩下的的索引使用这些整数 ID。所以只有那个包含每个字段的字符串名称的副本的文件将会更大。

因此缩短字段名称的效果将是最小的。然而，取决于您的映射，Elasticsearch中的存储可能比JSON源更小或更大，但这取决于映射以及您的数据的可能性如何。compressed in Elasticsearch。

2017-01-22 22:50:00 xeraa

是的..我们有WWIII机智mongodb :)如果ES缩短字段名称那太棒了。谢谢.. – Prometheus

回答