2017-10-12 118 views
3

单词相似性检查有哪些选项?Elasticsearch单词相似性

请考虑以下情况:我们有文档,其中字段电子邮件,存在。在添加新文档时,我们要检查是否有任何文档的电子邮件与新的文档相似,但有一些相似性约束 - 例如80%的匹配。

是否有任何特定的内置查询可以使用?

回答

0

您可以使用Fuzzy Query,您可以在参数fuzziness中提供搜索字符串和Levenshtein距离。 Query reference here

另外要计算Levenshtein距离百分比,this可能会有所帮助。

+0

elasticsearch中允许的最大Levenshtein编辑距离为2.因此Fizzy Query在当前情况下不起作用。 – user8763506