2013-10-24 18 views
3

是否有指定通过ruby从MS或Openoffice文档中删除组件的方法?我正在讨论删除宏/元信息以及删除/替换图像。我已经查看了许多转换程序,以便从/到相同文件格式进行转换,但是我找不到任何允许指定这些选项的转换程序。通过ruby从办公文档中删除宏等等

我看:

+0

是JRuby - 因此Java组件 - 是您的选择吗? – JasonPlutext

+0

@JasonPlutext我宁愿坚持ruby解决方案,因为我没有jRuby或Java的经验,但如果没有其他的选择。 – Simmo

回答

1

Docx文件真的是zip文件。您可以将它们解压缩(膨胀)到一个目录中,并删除或更改所需的文件,并更新对这些文件的引用。 zip内的文件是文本文件,XML,因此您可以使用LibXML-Ruby或Nokogiri。

+1

我曾希望有一些涵盖旧版Word的内容,但如果没有更好的答案,我会将您的标记标记为正确。很显然,我所寻找的目前并不存在,至少公开。 – Simmo