所以我试图计算两个大字符串(大约20-100)之间的距离。 障碍是性能,我需要运行20k距离比较。 (需要数小时)性能问题,编辑大字符串的距离LCP vs Levenshtein vs SIFT
经过调查,我发现了几个算法,而且我很难决定选择哪一个。 (基于性能VS准确度)
https://github.com/tdebatty/java-string-similarity - 每个算法的性能列表。
** ** EDITED
- 是SIFT4算法是一个良好的证明/可中继?
- SIFT4是否是正确的算法?
为什么它比基于LCP的/ Levinstein算法快得多?
剂量SIFT也用于图像处理?或者它是不同的东西?由AMH回答
谢谢。
我不能选择这个答案。 由于我不清楚,你提供的答案不是我想要问的。 另外我觉得你的答案对这个线程很有价值,所以我投了票。谢谢。 –