2016-08-05 83 views
0

我有没有标题的csv文件中的数据。我需要解析一些列。熊猫:从csv解析列

数据的一部分:

-1.0,-0.0246259814315,1174.60023796 
1.0,-0.978057706084,1083.19880269 
-1.0,0.314271994507,-1472.97760911 
-1.0,0.179751565771,231.017267343 
1.0,-1.26254374278,-778.271726463 
-1.0,0.249969939456,-52.8014826538 
1.0,-1.87039747875,-324.235348241 

我需要加载仅第二和第三列。我用train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[2, 3])但它返回IndexError: list index out of range

+1

你需要用方括号括起来:'tra in_X = pd.read_csv(“perception-train.csv”,parse_dates = [1])'也适用于usecols,你应该通过列名或列的序号位置列表 – EdChum

+1

使用'parse_dates = [1]'并保留记住列索引是从零开始的。 – albert

+0

@EdChum如果我想要展示两列,我应该使用两个支架? – ldevyataykina

回答

1

IIUC指数是从零开始的,所以你需要:

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[1], usecols=[1, 2]) 

此外,我不知道这是否也意味着你需要更改日期西:

train_X = pd.read_csv("perceptron-train.csv", sep=',', parse_dates=[0], usecols=[1, 2]) 

然而,看着你的数据我不明白如何解释第一或第二列作为日期时间,因为它们看起来很奇怪