读取CSV和筛选它基于列

-1

reader = pd.read_csv(csvfile, sep=';', header=0) 
list1=[] 
list2=[]

这里我按行读取CSV文件一行：

for row in reader.itertuples(): 
      list1.append(row)

然后我看着新列出并筛选它基于一个条件：

for i in range(len(list1)): 
     if(list1[i][5]==highestpointheight): 
       list2.append(list1[i])

现在我有一种基于条件过滤列表。

有没有其他有效的方法，以便我没有两个for循环？

来源

2017-05-03 User193452

为什么你会不使用熊猫['.sort']（你的'reader'对象上的http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort.html）？ –

如果您使用的是熊猫，您应该学会使用数据框而不是将它们转换为Python列表或numpy数组。 – xvan

@xvan：我需要这样的输出以便我的应用程序（graphql resolver）可以读取它：[Pandas（Index = 5，ullid = 1，sheetid = 2，highestpointheight = 332）]，我可以得到这个输出熊猫数据框？ – User193452

pd.read_csv(csvfile, sep=';', header=0).loc[lambda df: df[5] == highestpointheight, :]

见http://pandas.pydata.org/pandas-docs/stable/indexing.html#selection-by-callable

来源

2017-05-03 13:15:00 xvan

好的解决方案！ – MaxU

你可能要扭转这两个操作的顺序：

尝试：

reader = reader[reader.iloc[:, 5] == highestpointheight] # filter the 6th column based on highestpointheight 
for row in reader.itertuples(): 
     list1.append(row)

来源

2017-05-03 13:08:57

读取CSV和筛选它基于列

回答

相关问题