我有一个公司的XSD和XML示例文档。然而,当我尝试验证XML对XSD它失败:如何使用多种编码(或至少多种语言)验证XML
Error: Premature end of data in tag SomeTag line 2
有失败无明显原因,当我从文件中删除外文字符它验证。
我想使这个示例XML验证,但尽可能少的修改(即我宁愿不只是删除外国字符彻底)。我知道我不能在文档中添加第二种编码,但据我了解,它现有的编码(utf-8
)应该能够处理日文字符......如果它们使用UTF编码(显然来自失败,他们不是)。
所以我的问题是,有什么办法可以在一些(理想的OSS)程序中打开这个文档,然后用UTF-8编码保存它,这样日文字符不会打破验证?如果没有,有没有其他方法可以使文档验证 - 能够删除其中的每个外部字符?