我有一个包含大量数据的文本文件,它看起来是这样的:Python的解析文本文件的仅特定部分
logstart . . .
(chunk of data)
logend . . .
logstart . . .
(chunk of data)
logend . . .
times
logstart . . .
(chunk of data)
logend . . .
times
logstart . . .
(chunk of data)
logend . . .
我希望我的Python代码来打开文件和读取的数据块,如果和只有在它的“logend”下面有与它相关的“时间”。如果这个块没有时间,我希望它忽略它。当它读取正确的数据块时,我也希望它读取与之相关的时间。
这是我有什么之前,我意识到我需要提取仅某些部分(其中保存整个文本文件作为“行”):我怎样才能改变这种做法,
lines = []
with open(filename, 'rt') as in_file:
for line in in_file:
lines.append(line)
“线”现在只是文件的特定部分?
使用正则表达式似乎与're.findall'一起显示。 – FabienP
请发布更多信息。日志块样本以及您想要捕获的内容将有所帮助。 – Solaxun
我正在使用正则表达式来提取我需要的大块数据内的特定数据(因为我只需要它的一部分)。但是我目前的问题是让它只将我的代码的其余部分应用于文件的具有与其关联的特定部分的数据。 –