2017-06-16 84 views
0

我有一个Elasticsearch索引,其中包含大约25亿个文档,分析字段中包含大约1800万个不同的术语。是否有可能快速获得包含词汇的文档数量而不搜索索引?查找elasticsearch中包含术语的文档数

似乎ES会在分析字段时存储该信息,或者可能能够计算倒排索引的长度。如果有一种方法可以搜索多个术语并获取每个术语的文档频率,那会更好。我想定期进行数千次这样的尝试,而且我不知道是否有一种有效的方法来做到这一点。

回答

1

您可以使用Count API仅从查询返回计数,而不是完整的文档列表。

至于Elasticsearch是否为您提供了一种无需查询的方法:我相当有信心Elasticsearch没有在索引之外存储该信息,因为这正是lucene索引已经做的。这就是一个倒排索引,即按照术语索引的文档图。 Lucene的设计主要是通过有效的术语来查找文档。

+0

谢谢!我会和我的同事一起回顾一下。 – neelshiv

相关问题