这适用于较小的文本文件,但不适用于较大的文本文件。 (100,000行) 如何优化大型文本文件? 对于fileA中的行,如果fileB中的regexPattern ==行将fileA中的(整行)行写入fileC。Python:将一个文本文件中的正则表达式与另一个文本文件中的行进行比较
import re
with open('fileC.txt', 'w') as outfile:
with open('fileA.txt', 'rU') as infile1:
for line1 in infile1:
y = re.findall(r'^.+,.+,(.+\.[a-z]+$)', line1)
with open('fileB.txt', 'rU') as infile2:
for line2 in infile2:
if line2.strip() == y[0]:
outfile.write(line1)
Ok.But是什么这个问题? – Daenarys 2015-02-12 07:06:51
对于文件A中的每一行,您都要循环遍历文件B中的每一行。如果A中有100,000行,B中有100,000行,则您正在执行100亿次操作。这将需要一段时间... – 2015-02-12 07:07:28
谢谢。增加了一个问题。 – Woolwit 2015-02-12 07:21:08