2012-08-01 67 views
0

不太确定如何将单词的标题改为单词。基本上,当我搜索'动物'时会发现'动物',但是当我搜索'动物'时,它找不到任何东西。然后,如果我搜索'动物'它再次找到'动物'...Solr - 单词中间的结果停止

有没有人有任何想法,为什么它可能不会''动画'?这似乎发生在大多数单词上 - 但是在不同的角色 - 例如'eleph'和'elephan'都很好 - 但是'elepha'不会返回任何东西。

下面是查询和结果:

查询1(好)

/solr的/选择FQ =类型:标签& Q =名:动画

<response> 
<lst name="responseHeader"> 
<int name="status">0</int> 
<int name="QTime">1</int> 
<lst name="params"> 
<str name="fq">type:tag</str> 
<str name="q">name:anim</str> 
</lst> 
</lst> 
<result name="response" numFound="1" start="0"> 
<doc> 
<int name="id">1</int> 
<str name="name">Animals</str> 
<arr name="name_auto"> 
<str>Animals</str> 
<str>Animals</str> 
</arr> 
<date name="timestamp">2012-08-01T08:16:38.789Z</date> 
<str name="type">tag</str> 
<str name="unique_id">tag_1</str> 
</doc> 
</result> 
</response> 

查询2(不好)

/solr/select?fq = type:tag & Q =名:灵魂

<response> 
<lst name="responseHeader"> 
<int name="status">0</int> 
<int name="QTime">1</int> 
<lst name="params"> 
<str name="fq">type:tag</str> 
<str name="q">name:anima</str> 
</lst> 
</lst> 
<result name="response" numFound="0" start="0"/> 
</response> 

查询3(好)

/solr的/选择FQ =类型:标签& Q =名称:动物

<response> 
<lst name="responseHeader"> 
<int name="status">0</int> 
<int name="QTime">0</int> 
<lst name="params"> 
<str name="fq">type:tag</str> 
<str name="q">name:animal</str> 
</lst> 
</lst> 
<result name="response" numFound="1" start="0"> 
<doc> 
<int name="id">1</int> 
<str name="name">Animals</str> 
<arr name="name_auto"> 
<str>Animals</str> 
<str>Animals</str> 
</arr> 
<date name="timestamp">2012-08-01T08:16:38.789Z</date> 
<str name="type">tag</str> 
<str name="unique_id">tag_1</str> 
</doc> 
</result> 
</response> 

编辑1:

字段定义

<field name="name" type="text" indexed="true" stored="true" required="true" /> 

的字段类型:

<fieldType name="text" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true"> 
     <analyzer type="index"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <!-- in this example, we will only use synonyms at query time 
     <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/> 
     --> 
     <!-- Case insensitive stop word removal. 
      add enablePositionIncrements=true in both the index and query 
      analyzers to leave a 'gap' for more accurate phrase queries. 
     --> 
     <filter class="solr.StopFilterFactory" 
       ignoreCase="true" 
       words="stopwords.txt" 
       enablePositionIncrements="true" 
       /> 
     <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
     <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> 
     <filter class="solr.PorterStemFilterFactory"/> 
     </analyzer> 
     <analyzer type="query"> 
     <tokenizer class="solr.WhitespaceTokenizerFactory"/> 
     <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> 
     <filter class="solr.StopFilterFactory" 
       ignoreCase="true" 
       words="stopwords.txt" 
       enablePositionIncrements="true" 
       /> 
     <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/> 
     <filter class="solr.LowerCaseFilterFactory"/> 
     <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/> 
     <filter class="solr.PorterStemFilterFactory"/> 
     </analyzer> 
    </fieldType> 

编辑2:

传递字符串,虽然分析:

+1

这可能是由于干扰。把动物,动物和动物的文字放入分析框中,看看它们是如何被阻止的。这不是通配符搜索,因为您没有在搜索短语后添加星号。 – Ansari 2012-08-01 08:45:28

+0

我同意,你可以从你的Solr模式发布你的'name'字段定义(和相关的fieldType)吗? – javanna 2012-08-01 12:10:20

+0

@javanna - 请参阅上面的编辑1。Ansari,请参阅上面的编辑2。 – noel 2012-08-01 13:09:37

回答

1

安萨里是正确的,问题是由于制止。由于您使用的是PorterStemFilterFactory,因此您发布的Solr架构证明了它。如果要搜索部分单词,可以尝试使用通配符查询,具体取决于您使用的查询解析器。如果你使用的是SOlr 3.x,它们可能会太慢,而在使用Solr 4.x的情况下,这已经有了很大的改进。您可能想要制作EdgeNGrams,以便anima也匹配animals

+0

谢谢,干得好! – javanna 2012-08-02 11:28:24