2012-02-09 50 views

回答

0

一种方法是使用TermPositionVectors

您基本上会获得每个查询条件的职位,并按文档中的相同顺序计算他们在查询中出现的次数。

+0

**非常感谢您的回复! :)** 对不起,但它不适合,TermPositionVector拆分**字**。 String =“test bad word bad test bad bad bad” TermPositionVector的回复:{contents:bad/4,test/2,word/2} 我需要拆分短语**“bad word”**或**“糟糕的测试”**,这将是来自Lucene.Net的响应: “坏词”:“在文本中碰到两次” “坏测试”:“在文本中遇到过一次” – 2012-02-10 07:52:02

+0

我知道TermPositionVector是用词,但如果你有每个术语的位置,你当然可以找到并计算文档中的短语。查看IndexesOf()和GetTermPositions()方法。我知道你可以做到这一点,因为我过去做过,但我没有可用的代码发布样本。 – 2012-02-10 15:45:54

+0

**非常感谢,它帮助!** – 2012-02-10 20:57:29