2010-11-30 48 views
0

我正在为中国读者撰写一些网站,其中包含一些文章。在列出文章的页面上,我希望列出标题和文章的一小部分。但是,这些文章以不同Big5编码的混合编码。不要问我为什么 - 这就是我得到的 - 所以我不能保证每个字符需要编码的字节数。当使用Big5编码列出所有文章时,仅显示文章的一部分

我该如何裁剪字符串以仅显示文章的一小部分,而不会剔除编码字符所需的字节?

回答

0

如果您确定您不会在BMP之外有任何字符,那么您可以将文本转换为UCS-2,然后在平坦的边界上切片。