2016-10-18 36 views
1

Firefox可以以gb2312编码的HTML显示'囧'。但是u'囧'.encode('gb2312')会抛出UnicodeEncodeErroru'囧'.encode('gb2312')引发UnicodeEncodeError

1.是否有地图,firefox可以在该地图中查找gb2312编码字符,查找01显示矩阵并显示

2.是否有将unicode转换为gb2312的地图,但u'囧'不在该地图中?

+0

你确定它是在GB2312吗? [这张表没有](http://ash.jp/code/cn/gb2312tbl.htm)。 –

+0

你可以在(http://www.dytt8.net/)找到'囧',这个网页编码为gb2312。 – user3822769

回答

3

囧不在gb2312,用gb18030代替。我猜firefox可能会扩展编码方法,当她面对未知的字符。

2

当人们或软件说某事是GB2312编码时,他们通常意味着它是用Microsoft编码的GBK编码a.k.a.CP936编码的。 GB2312是20世纪80年代使用的GBK的子集,但都是same family of encodings的一部分。

顺便提及,即将推出的WhatWG的encoding specification建议将任何标记为“gb2312”的文本视为GBK编码的文本。

因此,请尝试u'囧'.encode('gbk')u'囧'.encode('cp936')u'囧'.encode('windows-936')