我有一个Python脚本解析XML文件,并返回以下错误:我可以绕过Python中的UnicodeDecodeError吗?
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 614617: character maps to <undefined>
我敢肯定,因为有XML文档我试图内的一些非法字符的错误发生解析,但我无法直接修复这个特定的XML文件,我正在阅读。
我能否拥有它,以便这些字符不会让我的脚本绊倒,并允许它保持解析没有错误?
这是脚本达的部分读取XML并对其进行解码:
def ReadXML(self, path):
self.logger.info("Reading XML from %s" % path)
codec = "Windows-1252"
xmlReader = open(path, "r")
return xmlReader.read().decode(codec)
错误是否发生在xmlReader或您自己的代码中? – 2012-03-06 19:25:20