我需要删除XML标签之间的任何东西,尤其是空格和换行符。删除XML标签及其内容之间的任何东西
例如去除空白和newslines:
< /节点> \ n <节点ID = “无所谓” >
获得:
< /节点> <节点ID = “无所谓” >
这并不意味着手工解析XML,而是在XML数据被工具解析之前准备好。更具体地说,我使用Hpricot(Ruby)来解析XML,不幸的是我们目前停留在版本0.6.164上,所以...我不知道更近的版本,但是这个经常返回奇怪的节点(对象)只包含空格和换行符。因此,这个想法是在将XML转换为Hpricot文档之前清理XML。替代解决方案感激
从测试的一个例子:NoMethodError:未定义的方法`孩子们的‘\ n’:角度来说,Hpricot ::文本
这里的有趣的部分是不是NoMethodError,因为这只是罚款,但该角度来说,Hpricot ::文本元素只包含一个换行符,仅此而已。
53秒! – tj111 2009-07-20 19:06:32