我通过一个包含几百条记录的ISI文件解析,这些记录全部以'PT J
'标记开头,并以'ER
'标记结尾。我试图从嵌套循环中的每个记录拉标签的信息,但不断得到一个IndexError。我知道为什么我会得到它,但是没有人比检查前几个字符有更好的方式来识别新记录的开始?Python文件解析 - > IndexError
while file:
while line[1] + line[2] + line[3] + line[4] != 'PT J':
...
Search through and record data from tags
...
我使用同样的方法,因此偶尔会得到同样的问题,识别标签,因此,如果您有任何建议,以及我将不胜感激!
样本数据,你会发现并不总是包含每个记录每一个标签,是:
PT J
AF Bob Smith
TI Python For Dummies
DT July 4, 2012
ER
PT J
TI Django for Dummies
DT 4/14/2012
ER
PT J
AF Jim Brown
TI StackOverflow
ER
我想指出,我在将它转换为.txt之前,以及在阅读之前。 – MTP 2012-07-06 02:47:56