可能重复:
How does the Google “Did you mean?” Algorithm work?谷歌的搜索如何知道你想说什么?
任何人都知道落后于谷歌的搜索IDEIA时,它似乎知道你是什么意思?
即:键入Michxael Gekson并发现迈克尔·杰克逊
可能重复:
How does the Google “Did you mean?” Algorithm work?谷歌的搜索如何知道你想说什么?
任何人都知道落后于谷歌的搜索IDEIA时,它似乎知道你是什么意思?
即:键入Michxael Gekson并发现迈克尔·杰克逊
当你有无限的资金,你可以花相当多的时间写跟踪算法,记录一下用户输入并检查他们的行为的每一个细节。当用户犯错时,他们通常会纠正错误。连续第二次提交告诉谷歌用户的意思,未来的用户可以提供最终的安息之地结果。谷歌将采取所有用户的相似性,并以最合理的方式编译参考树。
您是否正在自己的网站上寻找代码?祝你好运。
您可以查看Levenshtein距离算法,看看您是否可以使用它来编译自己的单词和关系列表。
统计语言处理,根据实际数据进行调整。
一个简单的示例是到达80%或90%的精度(以及有关解释它是如何工作),可以发现:http://norvig.com/spell-correct.html
我不知道如果谷歌使用这些特定的数据结构,但一做这种“模糊匹配”的方法是用Burkhard-Keller Tree (BK-Tree)。