我用这个可怕而低效的实现来找到可以删除最后连续的最后一个字母并且仍然是单词的单词。例如,Rodeo是一个众所周知的:Rodeo,Rode,Rod,Ro。 该程序发现'作曲家':作曲家,作曲家,撰写,作曲,对比Python-什么单词可以删除最连续的字母,仍然是字典有效的单词?
我想知道如何创建一个程序,找到最长的单词, )移除,它仍然被认为是一个字:
例如:野兽,最好的赌注,是 - 将是一个有效的可能性
这里是我的我的程序,以找到一个去除连续的字母(” m也有兴趣听听如何改进和优化):
#Recursive function that finds how many letters can be removed from a word and
#it still be valid.
def wordCheck(word, wordList, counter):
if len(word)>=1:
if word in wordList:
return (wordCheck(word[0:counter-1], wordList, counter-1))
else:
return counter
return counter
def main():
a = open('C:\\Python32\\megalist2.txt', 'r+')
wordList = set([line.strip() for line in a])
#megaList contains a sorted list of tuple of
#(the word, how many letters can be removed consecutively)
megaList = sorted([(i, len(i)-1- wordCheck(i, wordList, len(i))) for i in wordList], key= lambda megaList: megaList[1])
for i in megaList:
if i[1] > 3:
print (i)
if __name__ == '__main__':
main()
请注意['r +'也打开了_writing_]的文件(http://docs.python.org/library/functions.html#open)。除非你的程序实际上会修改你的字典,否则我建议将'open'模式改为'r'。 – sarnold 2011-05-21 22:23:00
对于你原来的问题,你可以从所有字典中生成一种特殊的[基数树](http://en.wikipedia.org/wiki/Radix_tree),最长的单词是这棵树中最长的路径。 – 2011-05-21 22:29:16
最近有人问到一个非常类似的问题,因此可能值得尝试几个搜索。这通常与anagrams的特殊情况有关,并且http://stackoverflow.com/questions/880559/algorithm-to-get-a-list-of-all-words-that-are-anagrams-of-all-substrings scrabbl可能是一个好的开始。 – 2011-05-21 22:32:02