我想计算按年份分组的文档中词的频率数据,然后将数据放入熊猫数据框中。如何创建词典列表
我的例程为每行创建一个字典,包含单词和频率作为键和值。然后,我想循环遍历数年,将字典互相追加,以创建一个字典列表,并将其转换为数据框。
从字典列表中创建数据框似乎是标准的;我可以通过手动创建列表来完成。
我希望能够做这样的事情:
wordtable = {'year':'1965','word1':20, 'word2': 250, 'word3': 125}
newrow={'year':'1966','word1':150, 'word4': 250, 'word2': 125}
wordtable.append(newrow)
df = pandas.DataFrame(wordtable, index=[0])
df.to_csv('testdata.csv')
但.append()会导致一条错误消息,.append()不带字典的工作类型。
尝试'wordtable = [{'year':'1965','word1':20,'word2':250,'word3':125}]]。 'append()'是一个'list'方法。 –
谢谢!但如果我将我的字典转换为list()列表,dataframe命令似乎不起作用。熊猫文献讨论'词典列表'让我感到困惑。 – Jon
你不需要多个词典列表,你想要一个*词典列表*。请参阅piRSquared的答案。 –