2017-05-06 60 views
0

所以我有一个数据框,其中'Art_Label'列具有文章分类的标签,可能的值是:'politica','deportes','elmundo',' OTROS', 'policiales', 'economia', '编辑'直方图上变量的标签

这里是从顶部

data = pd.read_csv('/filename.csv', sep=',') 
    data = data.drop('Unnamed: 0', axis=1) 
    data.columns 

指数([u'Date代码 'u'Title' ,u'Encabezado',u'Art_Label',u'Media'],dtype ='object')

import matplotlib.pyplot as plt 
%matplotlib inline 

df = data['Art_Label'] 
df2 = df.value_counts() 
df2.plot(kind = 'hist', xlim = (0,400)) 
print df2 

我想创建一个每个标签,它的频率直方图,我设法用'df2 = df.value_counts()'得到的频率,我希望能够得到直方图的每个值的标签:

这些都是我从'df2 = df.value_counts(取得)的成果“

politica  332 
deportes  323 
elmundo  192 
otros   191 
policiales 137 
economia  132 
editorial  96 
Name: Art_Label, dtype: int64 

回答

0

有点困惑你的问题。你想要这个数字吗?如果是这样,我觉得 '酒吧' 为u想要什么......

MM = pd.Series([332, 323, 192, 191, 137, 132, 96], index=['a', 'b', 'c', 'd', 'e', 'f', 'g']) 

MM.plot(kind = 'bar', xlim = (0,400)) 
plt.show() 

enter image description here