2011-06-03 63 views
1

我们在我们的Solr搜索中发现了词干,我们需要在词干后检索词/词组。那就是如果我搜索“橙子”,通过阻止搜索“橙子”被执行。如果我打开debugQuery,我将能够看到这一点,但是如果可能的话,我们希望通过结果访问它。基本上,我们需要这样做,因为我们将搜索到的单词作为参数传递给第三方应用程序,该应用程序会在在线PDF阅读器中突出显示单词。目前,如果用户搜索“桔子”并且文档包含“桔子”,那么PDF将不突出显示任何内容,因为它试图突出显示“橘子”而不是“橙色”。返回Solr中的词干

感谢所有提前,

Krt_Malta

+0

如何访问solr?如果您使用solrj java库,那么您可以按照本页底部所述显然访问突出显示:http://wiki.apache.org/solr/Solrj#Reading_Data_from_Solr – davek 2011-06-03 08:31:33

+0

我们使用基于SolrJ的API,因此可能是有用的。 highlightSnippets实际返回的是什么? – 2011-06-03 08:39:23

+1

在solr管理员窗体中尝试一下:... solr/icom/admin/form.jsp。将突出显示设置为启用并选择您的字段:该响应包含一组您可以解析的“突出显示”元素。 – davek 2011-06-03 08:53:10

回答

0

我和Solr的没有经验,但如果你需要它只是呈现给用户,你可以使用相同的词干Solr的使用自己干自己的疑问。这可能会更快,因为它会避免Solr的索引之旅。对于英文来说,这可能是http://tartarus.org/~martin/PorterStemmer/ - 或者你可以检查Solr的实现。

但是,一个谨慎的词,大多数词干算法并不能保证词干将是真正的单词。例如,请查看http://snowball.tartarus.org/algorithms/english/stemmer.html