2012-03-26 129 views
1

Levenshtein距离支持其实施还有哪些其他语言?非英语语言的Levenshtein距离

我知道的语言需要有基于单字符表示(而不是两个或多个字符在荷兰被视为一个单一实体一样?),想知道哪些语言秋/不属于这一类。

由于 阿布舍克巴克小号

+0

这是明确地脱离主题,这是一个关于自然语言的问题。 – 2012-03-26 09:17:27

回答

0

Levenshtein距离被限定在任意的字符串,在数学意义上;它不是语言特定的。你应该确保你在正确的表示水平上计算它,明智的默认值是在一些normalization之后的Unicode代码点的水平。如果你正在处理的语言总是需要两个符号来表示任何有意义的东西,那么就在成对的符号上计算Levenshtein距离。

[我不知道你所说的多个字符是在荷兰“一个单一的实体”的意思,但如果你的意思是ij ligature,从未阻止我申请莱文斯坦荷兰文:)]