我得到一些异常的XML文本输入,如:Java库逃脱/清理XML?
"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>"
我要清理输入这样得到:
"<Tag>something</Tag> 8 > 3, 2 < 3, ... <Tag>something</Tag>"
也就是说,逃避这些特殊符号像<,>时,仍能保留有效的标签(“,请注意,在同一个案例中)
你知道任何java库可以做到这一点吗? “程序)
孤儿'>'字符不是问题。但是,如何判断一个特定的'<'字符是一个标签还是一个小于符号? XML文档是否遵循单个DTD或XML Schema?或者,'<'*总是*后面跟着一个不是XML中的'Name'的数字吗? – erickson
他们不是我的XML文档,也没有模式。不幸的是,我发现一个“<”符号没有被一个空格或数字跟随的情况... – juanmirocks