0
我有一个XML文件是这样的:提取在不同的txt文件中的每个XML节点
<root>
<article>
<article_taxonomy></article_taxonomy>
<article_place>Somewhere</article_place>
<article_number>1</article_number>
<article_date>2001</article_date>
<article_body>Blah blah balh</article_body>
</article>
<article>
<article_taxonomy></article_taxonomy>
<article_place>Somewhere</article_place>
<article_number>2</article_number>
<article_date>2001</article_date>
<article_body>Blah blah balh</article_body>
</article>
...
...
more nodes
</root>
什么,我试图做的是给每个节点(从<article> to </article>
标签)提取出来并写成一个单独的TXT或XML文件。我想保留标签也。
是否有可能没有正则表达式呢?有什么建议吗?
我建议使用XML的一个模块,而不是正则表达式。它以正确的方式完成工作。顺便说一句,你的XML似乎没有一个根节点是有效的。 – 2014-09-03 14:09:50