2010-06-05 129 views
4

每当我尝试用特殊字符(如ō或満月先生)解析XML时,我都会收到错误。 xml文档声称使用UTF-8编码,但似乎并非如此。 这里是什么麻烦的文字看起来,当我查看XML在Firefox中,如:如何解析带有特殊字符的XML?

死神:钻石尘 反叛 - 中号Å Hitotsu没有 海兰Å rinmaru;漂白剂 - 本 钻石星尘反叛 - 牟Hitotsu没有 Hyourinmaru

在实际的网站,Å实际上是字符ō。

< BR/>有一天, 哆啦A梦和他的朋友们见面 满月教授 (æ º æ å&ccedil ;, 满月教授?),谁研究 法术和魔法众生如 妖精,和他的女儿美代子 (&ccedil;&frac34; å&CURREN; å ­, 美代子),并警告 丹哥的“ ”&“的明星 ”地狱“&”到地球&#轨道。 < BR/> < BR/>

再一次,实际的网站上,这些字符显示为満月先生以及美夜子。

实际的XML文件格式正确,而不是那些特殊字符,这些字符当然不会使用UTF-8编码。有没有办法让NSXML解析这些XML文件?

+0

看起来像UTF-8解释为拉丁-1和再编码。 – 2010-06-05 07:51:21

+0

正如我所提到的,在实际的网站上,字符显示为ō和満月先生,但在XML文档(在页眉中定义为UTF-8)中,它们显示为Å 和æº æ å ç 。你认为Firefox只是将字符解释为Latin-1,还是将创建XML文档的人搞砸了?如果我尝试使用NSUTF8StringEncoding在Xcode中加载XML,它不起作用。如果我指定了诸如NSASCIIStringEncoding或NSISOLatin1StringEncoding的编码,它将加载文档,但将ō显示为Å这是Å的编码(看起来像是数据丢失)。 – Snooze 2010-06-05 21:57:28

回答