2017-04-19 45 views
0

我想在Elasticsearch中定义一种新的索引方法,所以我将编辑tf idf方法。 哪里可以找到TF-IDF elasticsearch的实现? 弹性搜索源代码中的哪些包需要操作来实现新方法?在Elasticsearch中建立索引的新方法

回答

1

TF/IDF相似度算法在Lucene中实现,但是,有些方法可以通过similarity module定义另一个在Elasticsearch中使用的相似度算法。除了TF/IDF,目前有7 more similarities支持:

  • BM25
  • 经典相似
  • DFR相似
  • DFI相似
  • IB相似
  • LM狄氏相似
  • LM Jelinek Mercer相似度

他们每个人都有不同的参数,你可以调整。在冒险创建自己的产品之前,测试每个产品可能是个好主意。

有关可用Lucene的相似性的算法更多信息:https://lucene.apache.org/core/6_5_0/core/org/apache/lucene/search/similarities/Similarity.html

+0

测试这些相似之处后,我想创建一个自定义的相似性只是编辑BM25算法。就是有必要创建一个Java插件的任何想法做 – Sara