我有一个脚本,删除第二行,如果它有一个特定的模式。然而,当在包含数百个文件的文件夹上运行时,它非常慢,我必须等待5分钟左右才能完成。因为它是I/O我相信有一种方法可以加速或并行化你知道吗?这里是目前缓慢代码:如何加速(并行化)文本文件的编辑?
import datetime as dt
import os, re
for symb in os.listdir(r'C:\folder'):
n1=dt.datetime.now()
fh, abs_path = mkstemp()
new_file = open(abs_path,'w')
file_path = r'C:\folder' + '\\' + symb
print(repr(file_path))
old_file = open(file_path, 'r')
new_file = open(abs_path, 'w')
data = old_file.readlines()
if re.match('9:', data[1]):
print('YES')
del data[1]
for line in data :
new_file.write(line)
new_file.close()
close(fh)
old_file.close()
remove(file_path)
move(abs_path, file_path)
print(symb + ' : ' + str((dt.datetime.now()-n1).microseconds))