我有一个UTF8字符串管道从Java到Python。UTF8 python编码和解码
最终的结果是
'\xe0\xb8\x9a\xe0\xb8\x99'
因此,例如
a = '\xe0\xb8\x9a\xe0\xb8\x99'
a.decode('utf-8')
给我的结果
u'\u0e1a\u0e19'
不过,我很好奇,是因为字节作为管道UTF-8,为什么会是
'\xe0\xb8\x9a\xe0\xb8\x99'
而不是u'\u0e1a\u0e19'
。
如果我是编码(u'\u0e1a\u0e19')
我还是会回到'\xe0\xb8\x9a\xe0\xb8\x99'.
那么究竟是什么这两个怎么我的确了解什么时候使用解码和编码之间的固有差异。
..甚至“二百二十四”是二进制表示11100000的*十进制表示*,它仅仅是一些电子被推过某些掺杂硅的二进制表示*,它只是一个*标准模型表示*我们对亚原子粒子有些微弱的理解,这是弦理论的东西。 – roippi 2015-03-19 01:30:05
@Malvolio那么我什么时候使用解码和编码?说我要写这个字符串到一个文件。我是否需要将u'\ u0e1a \ u0e19编码为UTF8或将文件写入\ xe0 \ xb8 \ x9a \ xe0 \ xb8 \ x99文件中显示文件 – aceminer 2015-03-19 01:30:30
@aceminer中相应的UTF8字符บน我将我的答案显着扩展到回答你的问题。 – metatoaster 2015-03-19 01:38:38