2017-02-13 99 views
0

我想解析给定文件夹/子文件夹中的所有XML文件,并搜索并替换该XML内的文本。同时排除子文件夹“存档”。我得到的错误“AttributeError:'NoneType'对象没有属性'替换'”不知道我错过了什么,但是我的循环似乎死了一旦它到达ElementTree来打开和解析XML。递归解析所有XML文件并排除文件夹

for roots, dirs, files in os.walk("C:\test", topdown=True): 
    if 'Archive' in dirs: 
     dirs.remove('Archive') 
    #dirs[:] = [d for d in dirs if 'Archive' not in d] 
    for f in files: 
     if f.endswith('.xml'): 
      try: 
       with open(os.path.join(roots, f), 'r') as xml: 
        tree = ET.parse(xml) 
        root = tree.getroot() 

        for elem in root.getiterator(): 
        try: 
         print (elem.text) 
         elem.text = elem.text.replace('_THUMBNAIL.jpg', '.mxd.jpg') 

        except ET.ParseError: 
         pass 

       tree.write(xml, encoding='utf-8') 
      except FileNotFoundError: 
       pass 

回答

0

我猜并不是所有的XML标签都有文本。所以你应该使用

if elem.text is not None : 
    try: 
     print (elem.text) 
     elem.text = elem.text.replace('_THUMBNAIL.jpg', '.mxd.jpg') 
+0

嗯没有骰子。这似乎忽略了一切。 – Infinity8

+0

你可以显示你的xml的一小部分吗?看起来很奇怪。 – VdF