在这里可用的所有编码http://docs.python.org/library/codecs.html 哪一个是我应该用于将二进制数据解码为unicode,而不会在编码回字符串时被破坏的一个?二进制数据到Unicode
我用raw_unicode_data和它不工作。
例:I在POST上载图像(但不作为文件附件)。 Django使用utf-8将POST数据转换为unicode。但是,当从unicode转换回字符串(再次使用utf-8)时,数据将被损坏。我使用raw_unicode_data并且发生了同样的情况(尽管这次只有几个字节)。我应该使用哪种编码,以便解码和编码步骤不会破坏数据。
“二进制数据”?请定义你的意思,提供一个例子,甚至可能提供你用来读取,检索或构建这个东西的代码。 – 2011-02-23 18:01:18
这个例子似乎不可信。 bytes_representing_a_picture.decode(“utf-8”),是注定要失败,99.9% - 当然,除非如果Django使用了“忽略”或“替换”选项(aarrgghh) – 2011-02-24 01:02:16
@约翰 - 事实上它失败。 – 2011-02-25 14:42:52