我有相同结构的多个CSV文件,其原文件名后命名他们,我想读取多个CSV文件DataFrames和
- 分配文件数据框名称以相同的顺序:
1.csv -> data1, 2.csv ->data2
- 而以同样的方式分配列:
delta1 = data1["C"] - data1["A"]
我希望把它放到for循环,如下所示:
for i in range (1, 22):
data%i = pd.read_csv('CSV/' + str(i) + '.csv')
delta%i = data%i["C"] - data%i["A"]
# And I want to compare the 2 series from dataframe.column to find a set intersection
set(data1[data1.delta1 > 0].column) & set(data2[data2.delta2 == 0].column)
set(data2[data2.delta2 > 0].column) & set(data3[data3.delta3 == 0].column)
但肯定是错误的语法,在for循环,有没有更好的方式来编写它,这样的循环之后,我可以得到:
data1, data2, data3
...
相应:
delta1, delta2, delta3
...
对不起,你只是问如何添加一个新的列?如果是这样的话:'data ['delta'] = data ['C'] - data ['A']' – EdChum 2014-09-25 09:00:05
我的意思是在读取1.csv 2时如何将df名称分配为data1 data2 data3等。 csv withih for循环,可能吗? – 2014-09-25 15:28:29
这个名字有点不相关,你可以将生成的df附加到列表或字典中,名称只是对象的引用,为什么这很重要。从概念上讲,你所要求的对我没有意义,你需要更好地解释并编辑这个到你的问题 – EdChum 2014-09-25 15:30:59