我正在寻找一种简单高效的方式来存储ASCII-7中的UTF-8字符串。凭借高效的我指的是以下几点:ASCII编码的有效方法UTF-8
- 所有输入ASCII字母数字字符应保持相同的ASCII字母数字字符输出
- 生成的字符串应该是尽可能短
- 操作必须可逆式没有任何数据丢失
- 所得ASCII字符串应不区分大小写
- 应该有对输入长度
- 没有限制整个UTF-8范围应当allowe d
我的第一个想法是使用Punycode(IDNA),因为它符合前四个要求,但它在最后两个失败。
任何人都可以推荐一种替代编码方案吗?更好的是,如果有一些代码可供查看。
你是什么意思通过“输入中的所有ASCII字符都应该在输出中保留ASCII字符”?你在问什么是7位编码? – 2010-04-02 15:16:09
我更新了第一点,以便更清楚。我也忘了提及,我希望有大小写不敏感的输出,似乎排除UTF-7。 – 2010-04-02 15:38:46
当你说“生成的ASCII字符串应该不区分大小写”你是什么意思?字符串只是字符串,它们不区分大小写或不敏感。你的意思是它应该全部小写吗?全部大写? – 2010-04-02 16:03:32