我想打一个脚本,将从多个CSV文件复制第2列的文件夹中,并将其保存到一个CSV文件之前添加一些文字书写。复制列,添加一些文本,并在新的csv文件
这里就是我想要做的:从所有CSV文件
2)附加文本“Hello” &“欢迎”在开始的每一行
1)在第2列中获取数据并最终
3)将数据写入到一个文件中
我试着用熊猫
import os
import pandas as pd
dataframes = [pd.read_csv(p, index_col=2, header=None) for p in ('1.csv','2.csv','3.csv')]
merged_dataframe = pd.concat(dataframes, axis=0)
merged_dataframe.to_csv("all.csv", index=False)
创建它
的问题是 -
在上面的代码中,我不得不手动提的文件名,这是非常困难的,作为一个解决方案,我需要包括所有CSV文件
*.csv
需要使用类似
writr.writerow(("Hello"+r[1]+"welcome"))
由于在每个文件中有多个csv文件,并且有很多行(大约100k),所以我需要加快速度。
下面是CSV文件的一个样本:
"1.csv" "2.csv" "3.csv"
a,Jac b,William c,James
这里是我怎么想的输出看all.csv:
Hello Jac welcome
Hello William welcome
Hello James welcome
任何解决方案使用.merge()
.append()
或.concat()
??
我怎样才能做到这一点使用Python?
南希嗨。你可以像这样获得所有带有模块glob的csv文件:'paths = glob.glob('foo/*。csv')'。 –