4
我有一个大的列表(超过200,000)我想要比较给定的字符串的字符串。 给定的字符串是由用户插入的,因此它可能稍微不正确。基于预先计算的哈希比较字符串距离
我希望做的是创建一些预先计算的哈希每个字符串添加到列表。这个哈希将包含诸如字符串长度,所有字符的添加等信息。
我的问题是,这样的事情已经存在了吗?肯定会有东西让我避免在列表中的每个字符串上运行Levenshtein distance?
或者还有第三个选项我还没有想过呢?