我通过Python与Java应用程序接口。我需要能够构造包含utf-8字符串的字节序列。 Java使用在DataInputStream.readUTF()修订的UTF-8编码,这是不Python支持(yet at least)Python中修改的UTF-8字符串
任何人都可以点我在正确的方向来构建的Java修订的UTF-8字符串在Python?
更新#1:若要查看有关java修改的utf-8的更多信息,请查看第550行上的DataInput接口的readUTF方法here或here in the Java SE docs。
更新#2:我试图通过调用DataInputStream.readUTF使用此修改的utf8格式通过POST请求读取字符串的第三方JBoss Web应用程序接口(抱歉,有关正常java utf8字符串操作的任何混淆)。
在此先感谢。
“修改UTF-8”是什么意思?据我所知,Java使用完全标准的UTF-8,如果你要求它编码为UTF-8。请注意,虽然Java的本地字符串格式是UTF-16。 – 2009-09-08 09:41:29
嗨,Jon,我在DataInput接口中添加了一个readUTF方法的链接,它提到了一点。我会尝试挖掘更多信息。 – QAZ 2009-09-08 09:46:00
维基百科上有一些信息:http://en.wikipedia.org/wiki/UTF-8#Modified_UTF-8(所以,序列化,一些JNI和类内字符串常量)。 – McDowell 2009-09-08 09:47:48