我要创造我自己的分析,但只适用的StopFilter多字值,并仍然指数与一个字值(停用词本身)如何跳过的StopFilter一个字值
new Analyzer() {
protected Analyzer.TokenStreamComponents createComponents(String fieldName) {
final StandardTokenizer src = new StandardTokenizer();
TokenStream tok = new StandardFilter(src);
tok = new LowerCaseFilter(tok);
tok = new StopFilter(tok, StandardAnalyzer.STOP_WORDS_SET);
return new Analyzer.TokenStreamComponents(src, tok);
}
}
停用词
实施例,我有2个值:
1. this
2. this table
3. table
通过上述分析器,查询字符串是“这”,没有结果被发现。不过,我想与查询,结果应该包含值1(这个),并且不包含值2(此表)
你正在使用哪个版本的lucene? –
我正在使用版本5 – yelliver