2010-07-02 93 views
1

我想解析XML文件,更改一些属性并将结果写入新的XML文件。 给定的XML文件非常大(约2 GB)。处理生物XML文档

有没有人有使用Ruby处理这种XML文件的经验,并可以推荐我一个库?

问候

+0

远离它:-) – brainfck 2010-07-02 11:47:16

回答

1

首先,我假设你正在谈论在一堆元素的改变某些属性。这就是说,你不想一次读取整个文档(基于DOM的解析),你真的想要处理元素,就像你看到它们一样(基于SAX的解析)。我不是一个红宝石般的人,但是快速搜索发现了一些有关Ruby中SAX解析的良好信息,特别是这篇文章http://lucaguidi.com/2008/01/30/ruby-xml-parsing-with-sax

如果您只有少数几个元素的属性,那么我会推荐一种不同的方法。首先,如果您可以指定要作为正则表达式进行更改的项目,使用像sed这样的命令行工具来编辑文件可能会更简单。

+0

Jep,你说得对。我想删除一些属性以减少xml文件中给出的信息。感谢您的链接,它看起来很有趣,我会看看它! – brainfck 2010-07-02 11:45:34