我想创建一个文本中所有唯一字词的字典。关键是单词,值是这个词的频率创建文本字词典
dtt = ['you want home at our peace', 'we went our home', 'our home is nice', 'we want peace at home']
word_listT = str(' '.join(dtt)).split()
wordsT = {v:k for (k, v) in enumerate(word_listT)}
print wordsT
我希望这样的事情:
{'we': 2, 'is': 1, 'peace': 2, 'at': 2, 'want': 2, 'our': 3, 'home': 4, 'you': 1, 'went': 1, 'nice': 1}
不过,我收到这样的:
{'we': 14, 'is': 12, 'peace': 16, 'at': 17, 'want': 15, 'our': 10, 'home': 18, 'you': 0, 'went': 7, 'nice': 13}
很显然,我滥用功能或做错事。
请帮助
很好用!谢谢! – Toly
@当然是!很高兴我能帮上忙!你应该看看周围的集合,那里有很多有用的工具。“计数器”是一个,我也一直使用'defaultdict'。如果你有任何问题随时问,我会尽力帮助,如果我可以:) –
@JohnRuddell join()返回一个字符串,你为什么要把它转换为字符串?计数器(''.join(dtt).split())会做 – helloV