2013-06-12 60 views
0

在SOLR 3.5文本字段中,StopFilterFactory在PorterStemFilterFactory之前列出。SOLR词汇表和停用词

这是否意味着如果我想停止例如“游戏”和“游戏”,我将不得不添加到停用词?

如果是这样的话,在PorterStemFilterFactory之后移动StopFilterFactory,并且将“游戏”添加到停用词中会导致“游戏”和“游戏”的出现被剥离?

我想真正的问题是做这件事的最好方法是什么,我是否需要将单词的所有变体添加到停用词?

回答

2

PorterStemFilterFactory提供了积极的词干和有在之前停止词过滤器可能不会导致适当的停用词删除,因为根可能会不同,那么你试图停止。
只能在停用词过滤器之前使用solr.EnglishMinimalStemFilterFactory才能添加复数处理。
这将处理复数,然后停用词将需要处理单数版本。
然后,您可以添加PorterStemFilterFactory过滤器来处理正确的词干。

+0

谢谢 - 这个答案已经让我的眼睛看到了solr如何被使用! – dice

+0

* before *表示如何为特定字段排序这些过滤器? –