我有一系列文件,这些文件是按以下格式:Python的遍历多个文件
file_1991.xlsx
file_1992.xlsx
# there are some gaps in the file numbering sequence
file_1995.xlsx
file_1996.xlsx
file_1997.xlsx
因为我想这样做的每个文件:
import pandas as pd
data_1995 = pd.read_excel(open(directory + 'file_1995', 'rb'), sheetname = 'Sheet1')
做了一些工作数据,并将其保存为其他文件:
output_1995 = pd.ExcelWriter('output_1995.xlsx')
data_1995.to_excel(output_1995,'Sheet1')
而不是做所有这些对于每一个文件的,我怎么能经过多个迭代文件并在多个文件中重复相同的操作?换句话说,我想遍历所有的文件(它们主要遵循名称中的数字序列,但序列中存在一些空白)。
感谢您的帮助提前。
谢谢!我可以使用'glob'模块来分配变量名吗?例如,我需要通过分配类似如下内容来读取文件: 'data_1995 = pd.read_excel(open('file_1995.xlsx'),sheetname ='Sheet1')' –
@kfp_ny您为什么要这样做?你需要重新考虑你的程序。 –
@kfp_ny不,你不能,但如果你想保留文件,你可以使用一个字典,并在文件名后面命名键值,如果你想创建一个关系。但我建议不要这样做,并找到一种方法来保持它的动态,如果可以的话,因为每个文件都将被加载到内存中,否则您将遇到同样的问题。 – umutto