2017-09-13 55 views
0

我是熊猫的新手,我尝试总结我的csv文件。我创建了我的csv,其中包含Country和Count列,并使用熊猫来计算每个国家的总数。我也不确定我的csv格式是否正确转换或不正确。这是我的代码当我尝试使用熊猫来总结csv文件时,它不起作用

import pandas as pd 
df =pd.read_csv ("/Users/mani/Desktop/finalgeocount.csv") 
print df.groupby(['COUNTRY']).sum() 

这是我的原始csv文件数据

COUNTRY COUNT 

China 1 
China 1 
China 1 
China 2 
Ireland 1 
China 3 
Moldova 1 

我需要这样的输出:

China   8 
Ireland   1 
Moldova   1 

但我的输出显示如下图所示:

      Unnamed: 2 Unnamed: 3 Unnamed: 4 
COUNTRY              
Albania       NaN   NaN   NaN 
Algeria       NaN   NaN   NaN 
Angola        NaN   NaN   NaN 
Anguilla       NaN   NaN   NaN 
+0

df.columns的输出是什么? – Vaishali

+0

你的代码应该可以工作。确切的问题是什么? –

+0

@TedPetrou我已在我的帖子中更新了当前的输出内容。请检查 – Angeline

回答

1

您所拥有的原始数据sted是制表符分隔的,这是一种CSV格式。读取文件时,有助于指定分隔符:

>>> df = pd.read_csv('/Users/mani/Desktop/finalgeocount.csv', delimiter='\t') 
>>> df 
    COUNTRY COUNT 
0 China  1 
1 China  1 
2 China  1 
3 China  2 
4 Ireland  1 
5 China  3 
6 Moldova  1 
>>> df.groupby('COUNTRY').sum() 
     COUNT 
COUNTRY  
China  8 
Ireland  1 
Moldova  1 

N.B.我不得不整理一些原始数据,以便从第二个空白行删除一些零散的字符。

相关问题