我想在集合中的长查询和文档之间获得余弦相似度。我使用Lucence来为收集索引并提交查询来检索文档。Lucene中的查询和文档之间的余弦相似度
但是,我收到以下错误的一些查询。
"Caused by: org.apache.lucene.search.BooleanQuery$TooManyClauses: maxClauseCount is set to 1024"
我复制了一些在查询中的术语来提高他们的体重。但似乎lucene只是做简单的布尔检索,而不是使用tf-idf计算文档和查询的余弦相似度。
有人可以证实这一点吗?
谢谢克里斯托夫。 – ablimit