我有两个列表,下面,我想比较如果单词levenshtein距离小于2.我有一个函数来找到levenshtein距离,但作为它需要的参数这两个字。我可以找到哪些单词不在另一个列表中,但它没有帮助。我可以通过指数去指数,但如下面的情况下,当我到达指数7(但除了除外),所有事情都被抛弃了,因为不忠将是指数9和8,而wcop88是9和10,因此这些不会被比较。有什么方法可以说,如果不忠的一部分在另一个列表中的某个词中,然后检查这两个,请注意这并不总是奏效,因为如果说不忠和感染只有in和ty可以匹配,许多单词可以可能匹配levenshtein与python列表中的项目的距离
[u'rt', u'cuaimatizada', u's', u'cuaimaqueserespeta', u'forgives', u'any', u'mistake', u'but', u'the', u'infidelity', u'wocp88']
[u'rt', u'cuiamatizada', u's', u'cuimaqueserespeta', u'forgive', u'any', u'mistake', u'except', u'infedelity', u'wcop88']
编辑:所以我的目标是能够养活我的莱文斯坦功能这两个词需要进行检查。在这种情况下,以下配对:
u'cuaimatizada u'cuiamatizada
u'cuaimaqueserespeta u'cuimaqueserespeta
u'forgives u'forgive
u'infedelity u'infidelity
u'wocp88 u'wcop88
我不知道前面哪个单词。
?你的目标是什么? – 2012-07-11 16:28:12
林不知道你想要么...你在找'zip(list1,list2)'? – 2012-07-11 16:31:49
我编辑了我的目标 – jacobLoz 2012-07-11 16:33:35