我正在使用Lucene(或者更具体地说Compass)来记录论坛中的线程,并且我需要一种方法来提取讨论后面的关键字。也就是说,我不想索引某人所做的每个条目,但是我会列出与某个上下文相关的“关键字”列表,如果该条目与某个关键字匹配并且超出了我要添加的阈值这些条目到索引。查询不带索引的lucene令牌
我希望能够使用分析仪的能力去除事物并做出其魔力,但是然后从分析仪返回令牌以匹配关键字,并且还计算某些词的出现次数被提及。
是否有办法从分析器中获取令牌,而不必为每个条目编制索引?
我想我不得不保持RAMDirectory持有所有项,然后用我的关键字列表进行搜索,然后在相关文件中合并到持久性管理实际存储的相关条目。
任何人都知道下面的哪个答案更好......我正在寻找类似的问题 – andy 2010-06-03 05:55:41