我有一个庞大的文件,我需要为特定条目提供数据。文件结构是:提取两个符号之间的多行数据 - 正则表达式和Python3
>Entry1.1
#size=1688
704 1 1 1 4
979 2 2 2 0
1220 1 1 1 4
1309 1 1 1 4
1316 1 1 1 4
1372 1 1 1 4
1374 1 1 1 4
1576 1 1 1 4
>Entry2.1
#size=6251
6110 3 1.5 0 2
6129 2 2 2 2
6136 1 1 1 4
6142 3 3 3 2
6143 4 4 4 1
6150 1 1 1 4
6152 1 1 1 4
>Entry3.2
#size=1777
AND SO ON-----------
我必须达到的是我需要提取某些条目的所有行(完整记录)。对于e.x.我需要Entry1.1的记录,而不是使用条目名称> Entry1.1'直到下一个>>'作为REGEX中的标记来提取它们之间的行。但我不知道如何构建这样复杂的REGEX表达式。一旦我有这样的表情我就会把它FOR循环:
For entry in entrylist:
GET record from big_file
DO some processing
WRITE in result file
什么可以进行记录的这种提取特定条目正则表达式?有没有更多的pythonic方式来实现这一目标?我很感谢你对此的帮助。
AK
啊谢谢。我没有看到你看到我的答案。如果您需要改进,请询问。例如,有趣的是,用户可以输入** 1 1 **而不是** 1.1 ** – eyquem 2013-02-19 20:33:21