2010-10-15 77 views
1

我想从数千个相同的Excel 2007/2010文件中剥离数据。我宁愿使用刮擦技术来做到这一点。是否可以刮一个Excel文件,因为据我所知,该文件基本上是某种XML格式。Excel到XML数据剥离

那么,是否有可能将Excel文件转换为XML或其他标记格式?

+0

你使用的是什么环境和编程语言? – Oded 2010-10-15 18:53:36

+0

过去,我已经使用HTML敏捷性包和C#(在SSIS脚本中)来抓取XML数据;所以我希望将Excel文件转换为XML并从各种标签中刮取数据。 – ooutwire 2010-10-15 18:56:26

+0

因此,在VBA中使用Excel是不可能的?这是一种本土的做事方式。 – Oded 2010-10-15 18:58:41

回答

1

XLSX格式实际上是一个ZIP文件,但具有不同的扩展名。如果使用您最喜欢的zip程序解压缩它,您会发现工作表数据位于xl \ worksheets内。每个工作表都保存为一个单独的XML文档。您应该能够像Michael建议的那样使用XSLT来提取您需要的数据。

+0

完美!那完全解决了我的问题 – ooutwire 2010-10-15 19:12:55

0

默认情况下,Excel 2010文件采用XML格式。那么你的Excel文件目前处于什么文件格式(即他们有什么扩展名)?你的问题在这个问题上有些模棱两可。如果它们已经在XML中,那么可以使用XSLT来擦除它们。

+0

他们在XLSX;所以我只是在询问如何将它们从通用工作表格式转换为XML标记。几年前,我记得点击Excel中的一个按钮,可以看到标记而不是常规界面。 – ooutwire 2010-10-15 19:01:17