2009-11-21 59 views

回答

6

ASCII的前127个字符在所有ASCII派生字符集中都是相同的。它们在非ASCII字符集(例如EBCDIC)中不相同。

代码> 127的字符根据代码页和/或编码的不同而不同。

1

在UTF-16中,'abc'被编码为'0 97 0 98 0 99',这与ASCII非常相似,但是如果试图将其解释为ASCII,那么您最终会得到一个额外的NUL字符(或之后,取决于字节顺序)每个字符。没有太大的区别,但足以让它们不可互换。

+1

'abc'在UTF-16中也可以是'97 0 98 0 99 0'。您需要一个BOM来确定字节序。 – jmucchiello 2009-11-21 12:23:51

+1

其实,你不需要物料清单 - 它完全是可选的。您也可以选择从编码数据外部存储此信息以及编码信息。这不是推荐的方式,但绝对不一定要有BOM。 – 2009-11-21 12:28:07