我对ElasticSearch比较新。我正在使用它作为pdf文档的搜索平台。我把PDF分成文本页面,并将其作为一个elasticSearch记录,并输入相应的页面ID,父级信息等。使用ElasticSearch匹配多个文档
我发现很难将给定的查询不仅与ES中的单个文档进行匹配,但要使它与具有相同父代ID的任何文档匹配。因此,如果搜索了两个词语,如果实际PDF文档的第1页和第7页中存在这些词语(2个单独的词条进入ES),我想匹配这个结果。
本质上,我的目标是能够搜索单个PDF的多个页面,匹配PDF上的任何文档页面上发生的事件,并返回搜索结果的匹配PDF文档列表,而不是的匹配“页面”
非常感谢迄今为止的答案。我想澄清要求。 Duc.duong建议使用has_child,这似乎是最合乎逻辑的。我想补充一点,我需要能够确定(也许通过辅助查询)匹配发生的页面。 – lwdjustin