0
我正在使用Lucene.Net(版本Lucene 3.0.3)。在搜索关键字“The”时, 当有大量匹配该关键字的记录时,结果不会超过5个。 它适用于所有其他关键字。Lucene.Net无法搜索关键字“The”
是不是lucene有'The'的问题? :-)
我正在使用Lucene.Net(版本Lucene 3.0.3)。在搜索关键字“The”时, 当有大量匹配该关键字的记录时,结果不会超过5个。 它适用于所有其他关键字。Lucene.Net无法搜索关键字“The”
是不是lucene有'The'的问题? :-)
正如评论中所述,您的问题是您正在使用的分析仪。
StandardAnalyzer可以处理与语法有关的各种事情,但也会删除默认的一组英语停用词(a,and,或then等),“the”就是其中之一。
您可以像
var a new StandardAnalyzer(version, new HashSet<string>());
创建它给它一个空的HashSet说:“没有停止的话”
大多数人不希望搜索[停用词(HTTP:// stackoverflow.com/questions/17527741/what-is-the-default-list-of-stopwords-used-in-lucenes-stopfilter)。如果你这样做,你可以自定义它。 –
这可能取决于您使用的分析仪。例如。您很有可能拥有[StopFilter](http://lucene.apache.org/core/4_0_0/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html)。 –