2012-03-15 105 views
0

我正在使用Python将数据写入.xml文件。我有这个文件名为statistics.xml,每次我调用我的方法'writeIntoXml()'它应该将数据添加到该统计信息xml文件。现在Python完美地完成了这个任务,唯一的问题是在我写入新数据之前,它在文件中的所有元素之间添加了不需要的空白。就像这样:Python minidom不需要的空白

<AantalTicketsPerUur> 
    <Dag datum="2012-03-16"> 
     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 
     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 
     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 
     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 
    </Dag> 
</AantalTicketsPerUur> 

变成这样(没有这种空白的元素是其间新数据):

<AantalTicketsPerUur> 


    <Dag datum="2012-03-16"> 


     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 


     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 


     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 


     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 


    </Dag> 


    <Dag datum="2012-03-16"> 
     <Aantal_tickets Aantal="24" uurinterval="0u-1u"/> 
     <Aantal_tickets Aantal="68" uurinterval="1u-2u"/> 
     <Aantal_tickets Aantal="112" uurinterval="2u-3u"/> 
     <Aantal_tickets Aantal="98" uurinterval="3u-4u"/> 
    </Dag> 
</AantalTicketsPerUur> 

我该如何解决这个问题?注:我确实使用了.toprettyxml()方法提前

感谢

回答

1

你可能想使用toxml代替toprettyxml不修改格式:

def write_xml(filename, dom): 
    f = open(filename, "w") 
    f.write(dom.toxml("utf-8")) 
    f.close() 
0

我的答案同意来自qgi。但请注意,这两种方法对于在根元素之外发现的评论似乎有着相反的怪癖。例如,如果我用解析这个minidom命名XML文件...

<?xml version="1.0" encoding="utf-8"?> 

<!-- testing 1 --> 
<!-- testing 2 --> 

<sources autodelete="false" syncmedia="true" multivalue_separator=";; "> 

    <!-- testing 3 --> 
    <source 
     id_field="Lex GUID" 
     source_audio_folder="samples/audio" 
     source_image_folder="samples/pictures" > 
     <source_field anki_field="Lex GUID" /> 
    </source> 

    <!-- Test blah blah 
     blah blah 
     blah 
    --> 
    <source 
     id_field="Example" 
     source_audio_folder="samples/audio" 
     source_image_folder="samples/pictures" > 
     <source_field anki_field="Example" /> 

    </source> 

</sources> 

<!-- test THE END --> 

...然后我把它保存为两个不同的文件,保留toxml用于那些精美的外侧部分(但没有根内侧),和toprettyxml只保留根部内的部分。我正在使用Python 2.7 BTW。这里是tmp1.xml( '漂亮'):

<?xml version="1.0" encoding="utf-8"?><!-- testing 1 --><!-- testing 2 --><sources autodelete="false" multivalue_separator=";; " syncmedia="true"> 

    <!-- testing 3 --> 
    <source id_field="Lex GUID" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 
     <source_field anki_field="Lex GUID"/> 
    </source> 

    <!-- Test blah blah 
     blah blah 
     blah 
    --> 
    <source id_field="Example" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 
     <source_field anki_field="Example"/> 

    </source> 

</sources><!-- test THE END --> 

...这里是tmp2.xml(普通的toString):

<?xml version="1.0" encoding="utf-8"?> 
<!-- testing 1 --> 
<!-- testing 2 --> 
<sources autodelete="false" multivalue_separator=";; " syncmedia="true"> 



    <!-- testing 3 --> 


    <source id_field="Lex GUID" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 


     <source_field anki_field="Lex GUID"/> 


    </source> 



    <!-- Test blah blah 
     blah blah 
     blah 
    --> 


    <source id_field="Example" source_audio_folder="samples/audio" source_image_folder="samples/pictures"> 


     <source_field anki_field="Example"/> 



    </source> 



</sources> 
<!-- test THE END --> 

以防万一,这里是所产生的Python代码那些:

import xml.dom.minidom as minidom 
tree = minidom.parse(file_path) 
s1 = tree.toxml('utf-8') 
s2 = tree.toprettyxml(' ', '\n', 'utf-8') 
with open ('tmp1.xml', mode='w') as outfile: # Python 3 would also allow: encoding='utf-8' 
    outfile.write(s1.encode('utf-8')) 
with open ('tmp2.xml', mode='w') as outfile: 
    outfile.write(s2.encode('utf-8')) 
+0

这两种方法似乎产生不一致的新行(有时作为CR,有时作为CR LF;又名\ r或\ r \ n)。好消息是toprettyxml()的输出可以读回来,然后用*相同的格式保存回来,如果我可以在每个元素之间使用它想要的3-4个空行 – 2014-02-01 22:08:55