在ASCII中,字符<被编码为单字节字符0x3C,我想知道的是有没有一个字符集,其中<的编码方式不同?我试过UTF-8,它是一样的。我试过GB2312,它是一样的...在所有字符编码中,ASCII字符是否总是以相同的方式编码?
另一个问题,所有字符集中的所有ASCII字符都是相同的吗?
在ASCII中,字符<被编码为单字节字符0x3C,我想知道的是有没有一个字符集,其中<的编码方式不同?我试过UTF-8,它是一样的。我试过GB2312,它是一样的...在所有字符编码中,ASCII字符是否总是以相同的方式编码?
另一个问题,所有字符集中的所有ASCII字符都是相同的吗?
ASCII的前127个字符在所有ASCII派生字符集中都是相同的。它们在非ASCII字符集(例如EBCDIC)中不相同。
代码> 127的字符根据代码页和/或编码的不同而不同。
在UTF-16中,'abc'被编码为'0 97 0 98 0 99',这与ASCII非常相似,但是如果试图将其解释为ASCII,那么您最终会得到一个额外的NUL字符(或之后,取决于字节顺序)每个字符。没有太大的区别,但足以让它们不可互换。
不,有一些非官方的区域变体ISO-646其中differ quite a lot from ASCII。
'abc'在UTF-16中也可以是'97 0 98 0 99 0'。您需要一个BOM来确定字节序。 – jmucchiello 2009-11-21 12:23:51
其实,你不需要物料清单 - 它完全是可选的。您也可以选择从编码数据外部存储此信息以及编码信息。这不是推荐的方式,但绝对不一定要有BOM。 – 2009-11-21 12:28:07