我有一个uniqueWordList有很多单词(100.000+)。 这些词的每一个的卦都在集合allTriGrams中。加速n-gram处理
我想要建立一个字典,其中包含所有独特的卦作为键 以及这些卦可以作为值匹配的所有单词。
实施例:
epicDict = {‘ban’:[‘banana’,’banned’],’nan’:[‘banana’]}
到目前为止我的代码:
for value in allTriGrams:
for word in uniqueWordList:
if value in word:
epicDict.setdefault(value,[]).append(word)
我的问题: 此方法采用大量的时间。有什么办法可以加快这个过程吗?
谢谢,相当快! – klabanus