2016-09-23 123 views
0

我正在使用Lucene.Net(版本Lucene 3.0.3)。在搜索关键字“The”时, 当有大量匹配该关键字的记录时,结果不会超过5个。 它适用于所有其他关键字。Lucene.Net无法搜索关键字“The”

是不是lucene有'The'的问题? :-)

+4

大多数人不希望搜索[停用词(HTTP:// stackoverflow.com/questions/17527741/what-is-the-default-list-of-stopwords-used-in-lucenes-stopfilter)。如果你这样做,你可以自定义它。 –

+1

这可能取决于您使用的分析仪。例如。您很有可能拥有[StopFilter](http://lucene.apache.org/core/4_0_0/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html)。 –

回答

0

正如评论中所述,您的问题是您正在使用的分析仪。

StandardAnalyzer可以处理与语法有关的各种事情,但也会删除默认的一组英语停用词(a,and,或then等),“the”就是其中之一。

您可以像

var a new StandardAnalyzer(version, new HashSet<string>()); 

创建它给它一个空的HashSet说:“没有停止的话”