我试图解析XML文件,但遇到错误消息“2字节的UTF-8序列的无效字节2。是否有人知道是什么导致了这个问题?谢谢。2字节UTF-8序列的无效字节2
回答
要么解析器设置为UTF-8,即使文件被其他编码或文件被声明为使用UTF-8,但它确实没有。
最常见的是由于(Latin-x,与Latin-1类似),但解析器认为它获得了UTF-8
。拉丁文-1字符的某些序列(带有重音或变音符号的两个连续字符)形成的东西无效,如UTF-8
,特别是基于第一个b yte,第二个字节有意想不到的高位。当某些处理使用Latin-1的转储出XML
这可容易地发生,但无论哪种忘记输出XML
声明(在这种情况下XML
解析器必须默认为UTF-8
,按照XML
规格),或权利要求它的UTF-8
甚至当它不是。
关于如何解决这个问题的任何建议?在使用第三方库XMLTask定义一个ant任务时遇到了这个问题。 – AgentKnopf 2012-03-27 15:55:23
那很困难;否则通常要做的是为特定编码显式创建一个InputStreamReader,然后将其提供给XML解析器。但不知道如何处理Ant ......除了修复XML文件本身,如果可能的话。 – StaxMan 2012-03-27 17:52:58
我想出了这个问题 - 在我的一个xml中,我有一个变音(ä,ö,ü),当我将xml文件转换为不同格式时,它会以某种方式搞砸了。一旦我删除了变音符,它就解决了。 – AgentKnopf 2012-03-27 18:10:59
您可以尝试将String.getBytes()使用的默认字符编码更改为utf-8。使用VM选项-Dfile.encoding = utf-8。
我有同样的问题。我的问题是我创建了一个新的XML文件与jdom和FileWriter(xmlFile)。 FileWriter无法创建UTF-8文件。 而是使用FileOutputStream(xmlFile)解决了它。
对于那些仍然有这样的错误。
因为UTF-8被用来检查你的XML文档的任何拉丁字母左右: 我有同样的问题,究其原因,我有这个:
<n:name>Åke Jógvan Øyvind</n:name>
希望这有助于
当我试图将我的.xml文件导入到我的java工具中时,我也遇到了同样的问题。我找到了一个很好的解决方案: 1.用Notepad ++打开.xml文件,然后将.xml文件保存为.rtf文件。然后在写字板应用程序中打开此文件。 2.将.rtf文件保存为.txt文件,然后用记事本打开它,并将其另存为.xml文件。在记事本中保存时,在弹出窗口的末尾附近,确保选择“编码:UTF-8”选项。 它为我的工作,希望它也对你有用。
- 1. MalformedByteSequenceException:2字节的UTF-8序列无效的字节2
- 2. JSF 2异常:com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException:3字节UTF-8序列的无效字节2
- 3. 无效字节2 4字节文档解析
- 4. PostgreSQL的:“无效的字节序列编码‘UTF8’:只对错误
- 5. Postgresql PHP无效的字节序列编码UTF8
- 6. PostgreSQL - Psycopg2 - copy_from - 用于编码“UTF8”的无效字节序列:0x00
- 7. 具有特殊字符的Facelets页面导致MalformedByteSequenceException:UTF8Reader.invalidByte中的3字节UTF-8序列的无效字节2
- 8. 的PyUnit:无法读取XML-RPC请求:无效字节2 3字节的UTF-8序列
- 9. “1字节UTF-8序列的无效字节1”错误
- 10. getResponseBodyAsStream返回 “1字节UTF-8序列的无效字节1”
- 11. 1字节UTF-8序列的无效字节1
- 12. 无效字节1个字节的UTF-8序列错误
- 13. 引起:com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException:1字节UTF-8序列的无效字节1
- 14. 多字节的UTF8字符
- 15. Postgres列加密错误 - 用于编码“UTF8”的无效字节序列:0xa3
- 16. Rails 3中,Heroku的 - PGError:错误:编码 “UTF8” 无效的字节序列:
- 17. 的PostgreSQL 9.5错误:编码“UTF8”无效的字节序列:0xc3 0xee
- 18. 修改的2个字节
- 19. 如何在参数化SQL查询中避免无效的UTF8字节序列?
- 20. 错误:在pgadmin中插入用于编码“UTF8”的无效字节序列
- 21. “在EDB加载器中编码为”UTF8“:0x00”的无效字节序列
- 22. Java无符号字节[2]为int?
- 23. JAXB错误的说明:1字节UTF-8序列的字节1无效
- 24. PicketLink:'错误:无效字节序列编码“UTF8”:设置密码时为0x00'
- 25. Java中的字符是1个字节还是2个字节?
- 26. BitConverter.ToInt32转换2个字节
- 27. 变化串2字节
- 28. freading 2字节长整型
- 29. 合并2个字节
- 30. 2字节表示2008年
你如何解析XML文件? – jtahlborn 2011-05-04 02:14:48