2016-03-15 110 views
2

我刚开始为我的新工作学习python,所以对我来说一切都很困难,即使这个任务听起来很直截了当。用python提取多个xml文件中的数据

我想提取多个XML的文件几个节点,最好把信息转化为最终的Excel文件。每行应该包含来自一个xml文件的信息,这些列应该代表我正在寻找的特定节点,比如“Zip-code”“town”。并不是所有的xml文件都包含所有的节点,所以它会是完美的,如果节点“Zip-code”不存在,它只会将单元格留空。

可能有人请指出一些提示如何开始与这个或,这也是可能的,一个特殊的PROGRAMM,这是很容易学习和使用?我的公司和我只需要为约2000个文件做一次。

非常感谢你=)

+1

使用BeautifulSoup4 –

+0

和使用openpyxl – Jay

回答

2

为了打开文件,并得到他们的内容,你可以使用Python函数:Documentation

XML解析,我总是用Beautiful Soup。这是一个具有良好文档的HTML/XML解析器,大部分“正常工作”。

有关创建Excel文件,你可以使用Xlsxwriter

+0

谢谢丹尼尔的回答。如果我有更具体的问题,我会尝试这些提示,如果可能的话,会回复给你=) –

相关问题