我有一列熊猫数据框:犯罪类型。该栏包含16种不同的“犯罪类别”,我希望将其视为词云,并根据其数据框内的频率确定字数。从单列熊猫数据框中生成单词云
我试图用下面的代码来做到这一点:
为了使数据:
fields = ['Crime type']
text2 = pd.read_csv('allCrime.csv', usecols=fields)
要生成词云:
wordcloud2 = WordCloud().generate(text2)
# Generate plot
plt.imshow(wordcloud2)
plt.axis("off")
plt.show()
但是,我收到此错误:
TypeError: expected string or bytes-like object
我能够使用以下代码从完整数据集中创建早期词云,但我希望词云只能从特定列'犯罪类型'('allCrime.csv')生成单词,包含约。 13列):
text = open('allCrime.csv').read()
wordcloud = WordCloud().generate(text)
# Generate plot
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
我是新来的Python和大熊猫(和编码一般!),所有的帮助是感激地收到。
你可能要检查[这](http://stackoverflow.com/questions/42193013/wordcloud-for-a-csv-file-in-python)... – MaxU