3
我想在Solr中使用NGramFilterFactory(在Rails中使用太阳黑子)来查找相似的标题。我设法一个新字段添加到我的Solr schema.xml中像如下:使用Solr的NGramFilterFactory进行相似性搜索
<fieldType name="text_ngrm" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="4"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
由于我在Rails应用程序中使用sunpsot,因此通过动态领域增加了新的领域,以黑子。这一切工作,我现在可以使用NGramFilterFactory搜索我的模型。我不确定的是,如何配置solr以搜索相似的标题。这里是我的具体问题:
- 当我试图查询类似的标题时使用dismax查询分析器是否有意义?
- (Minimum 'Should' Match)参数如何帮助我找到类似的标题?
- 根据什么我会选择ngram min。和最大。大小?
感谢您的任何反馈。