2017-07-30 128 views
0

我想直接从网站加载数据集到jypyter笔记本,但每次尝试使用python熊猫的'read_csv'上载数据集时,都会导入数据集但我无法从数据集中选择任何列。IndexError:索引2超出轴1的范围,大小为

这里是我的代码:

url = "http://ww2.amstat.org/publications/jse/datasets/fishcatch.dat.txt" 
df = pd.read_csv(url, sep= '\t', header= 0) 

print df 

     1  1  242.0  23.2 25.4 30.0 38.4 13.4 NA 
0  2  1  290.0  24.0 26.3 31....     
1  3  1  340.0  23.9 26.5 31....     
2  4  1  363.0  26.3 29.0 33....     
3  5  1  430.0  26.5 29.0 34.... 

这是我得到的,当我尝试在数据集中访问第3列

df[:,2] 

IndexErrorTraceback (most recent call last) 
<ipython-input-27-910d22bca5b5> in <module>() 
    ----> 1 df[:,2] 

IndexError: index 2 is out of bounds for axis 1 with size 1 

我是新来的编码和使用python 2 jupyter错误笔记本。任何形式的帮助,将不胜感激。

+0

你需要'iloc'。 'df.iloc [:,2]' – Psidom

回答

0

要加载的数据帧,使用

df = pd.read_csv(url, delim_whitespace=True, header=0) 

看来你的数据不是简单的制表符分隔。因为熊猫不能正确分析数据,所有内容都被初始化为一列。

此外,要访问第3列,应该使用df.iloc[:, 2]

相关问题