Python minidom不需要的空白

我正在使用Python将数据写入.xml文件。我有这个文件名为statistics.xml，每次我调用我的方法'writeIntoXml（）'它应该将数据添加到该统计信息xml文件。现在Python完美地完成了这个任务，唯一的问题是在我写入新数据之前，它在文件中的所有元素之间添加了不需要的空白。就像这样：Python minidom不需要的空白

<AantalTicketsPerUur> 
    <Dag datum="2012-03-16"> 
     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 
     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 
     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 
     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 
    </Dag> 
</AantalTicketsPerUur>

变成这样（没有这种空白的元素是其间新数据）：

<AantalTicketsPerUur> 


    <Dag datum="2012-03-16"> 


     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 


     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 


     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 


     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 


    </Dag> 


    <Dag datum="2012-03-16"> 
     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 
     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 
     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 
     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 
    </Dag> 
</AantalTicketsPerUur>

我该如何解决这个问题？注：我确实使用了.toprettyxml（）方法提前

感谢

来源

2012-03-15 Confituur

你可能想使用toxml代替toprettyxml不修改格式：

def write_xml(filename, dom): 
    f = open(filename, "w") 
    f.write(dom.toxml("utf-8")) 
    f.close()

来源

2012-11-06 11:04:16

我的答案同意来自qgi。但请注意，这两种方法对于在根元素之外发现的评论似乎有着相反的怪癖。例如，如果我用解析这个minidom命名XML文件...

<?xml version="1.0" encoding="utf-8"?> 

<!-- testing 1 --> 
<!-- testing 2 --> 

<sources autodelete="false" syncmedia="true" multivalue_separator=";; "> 

    <!-- testing 3 --> 
    <source 
     id_field="Lex GUID" 
     source_audio_folder="samples/audio" 
     source_image_folder="samples/pictures" > 
     <source_field anki_field="Lex GUID" /> 
    </source> 

    <!-- Test blah blah 
     blah blah 
     blah 
    --> 
    <source 
     id_field="Example" 
     source_audio_folder="samples/audio" 
     source_image_folder="samples/pictures" > 
     <source_field anki_field="Example" /> 

    </source> 

</sources> 

<!-- test THE END -->

...然后我把它保存为两个不同的文件，保留toxml用于那些精美的外侧部分（但没有根内侧），和toprettyxml只保留根部内的部分。我正在使用Python 2.7 BTW。这里是tmp1.xml（ '漂亮'）：

<?xml version="1.0" encoding="utf-8"?><!-- testing 1 --><!-- testing 2 --><sources autodelete="false" multivalue_separator=";; " syncmedia="true"> 

    <!-- testing 3 --> 
    <source id_field="Lex GUID" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 
     <source_field anki_field="Lex GUID"/> 
    </source> 

    <!-- Test blah blah 
     blah blah 
     blah 
    --> 
    <source id_field="Example" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 
     <source_field anki_field="Example"/> 

    </source> 

</sources><!-- test THE END -->

...这里是tmp2.xml（普通的toString）：

<?xml version="1.0" encoding="utf-8"?> 
<!-- testing 1 --> 
<!-- testing 2 --> 
<sources autodelete="false" multivalue_separator=";; " syncmedia="true"> 



    <!-- testing 3 --> 


    <source id_field="Lex GUID" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 


     <source_field anki_field="Lex GUID"/> 


    </source> 



    <!-- Test blah blah 
     blah blah 
     blah 
    --> 


    <source id_field="Example" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 


     <source_field anki_field="Example"/> 



    </source> 



</sources> 
<!-- test THE END -->

以防万一，这里是所产生的Python代码那些：

import xml.dom.minidom as minidom 
tree = minidom.parse(file_path) 
s1 = tree.toxml('utf-8') 
s2 = tree.toprettyxml(' ', '\n', 'utf-8') 
with open ('tmp1.xml', mode='w') as outfile: # Python 3 would also allow: encoding='utf-8' 
    outfile.write(s1.encode('utf-8')) 
with open ('tmp2.xml', mode='w') as outfile: 
    outfile.write(s2.encode('utf-8'))

来源

2014-02-01 21:54:21

这两种方法似乎产生不一致的新行（有时作为CR，有时作为CR LF;又名\ r或\ r \ n）。好消息是toprettyxml（）的输出可以读回来，然后用*相同的格式保存回来，如果我可以在每个元素之间使用它想要的3-4个空行 – 2014-02-01 22:08:55

Python minidom不需要的空白

回答

相关问题