我希望如果一个lucene文档包含单词芝士汉堡和用户搜索汉堡这个文件来。我看到我可能需要一个自定义分析器来将此复合词分解成干酪和汉堡。但是,闯词也可能带来不相关的结果。Lucene在搜索汉堡时带上芝士汉堡
例如:如果索引生产我们索引时产品和离子为好,那么当包含生产离子文档的用户搜索会出来,这是不相关的。
所以一个简单的分词器不会削减它。我需要知道芝士汉堡关联到汉堡和奶酪的一种方式,但生产没有关联到离子。
有没有一个更聪明的过程来实现这一目标?
这是否有一个名称就像词根是将单词缩减为其根形式?
+1因为我现在吃了芝士汉堡 – Soader03 2012-04-24 15:57:50