15
例如Soundex算法针对英语进行了优化。是否有更适用于大型语言族的更通用的算法?如何制作国际Soundex?
例如Soundex算法针对英语进行了优化。是否有更适用于大型语言族的更通用的算法?如何制作国际Soundex?
SOUNDEX确实是以英语为导向的。考虑到更广泛的语音差异的另外两个是:Double Metaphone和NYSIIS。
它们产生的编码可能比SOUNDEX大得多。双倍变音器,具体地说,包括基于比英语更多的语言处理替代发音的明确目的的减少。
我最近做了关于模糊字符串匹配的演示,the slides可能会有所帮助。
您的幻灯片的链接已损坏(404) – 2009-09-26 05:29:25