我有一个具有以下格式的巨大文本文件(作为ASCII文件)。我正在使用python进行处理。对于这种文件,我有几个问题(以更通用的方式)。按特定顺序搜索文本文件数据的特定格式
- 如何检查数据格式的正确性?有没有办法指定一个模板,然后验证这些文本文件的正确性? (类似于xml的dtd文件)。
- 第二个问题是解析这些文件并从文件中读取数据。就像我期待的
XYZ
数据出现在time
行之后,需要解析它们。这种情况下的任何简单机制?再次像模板和分析机制。
===========================BEGIN=========================================
2012-12-05 12:03
XYZ 123(0) 654(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:04
XYZ 123(0) 654(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:05
XYZ 523(0) 654(2) 235(4)
MON 83(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================
===========================BEGIN=========================================
2012-12-05 12:03
XYZ 193(0) 644(2) 232(4)
MON 23(0) 54(2) 32(4)
POR 13(0) 64(1) 92(2)
=========================== END =========================================