2009-12-23 43 views
3

是否可以比较来自多个Lucene索引的数据?我希望在两个索引中获得在类似字段(如名字,姓氏)中具有相同值的文档。 Lucence是否支持可以执行此操作的查询?Lucene - 比较多个索引中的数据

回答

2

好吧,部分。您可以在索引中构建相同的文档模式,并且至少可以正确地获取匹配的集合。但是,如Lucene Similarity documentation所示,Lucene评分中的idf(逆文档频率)因子取决于索引大小和索引中具有搜索项的文档数量。这两个因素都与指数有关。因此,根据这些因素,来自不同指标的相同匹配可能得到不同的分数。

+0

没错。但是,我怀疑,从给出的例子来看,确切的顺序可能并不那么重要(因为它是匹配/不匹配类型的查询)。因此,忽略IDF应该没问题。 – 2009-12-25 04:42:19