将字符串从Unicode转换为ASCII而不更改其长度(在我的情况中非常重要)的最佳方法是什么?此外,没有任何转换问题的字符必须与原始字符串处于相同的位置。 所以一个“Ä”必须转换为“A”,而不是含有更多字符的神秘东西。将Unicode转换为ASCII而不更改字符串长度(用Java)
编辑:
@novalis - 这些符号(例如亚洲语言)应该转换为一些占位符。我对这些词或他们的意思不太感兴趣。
@MtnViewMark - 在任何情况下,我必须保留所有字符的数量和ASCII可用字符的位置。
这里有一些更多的信息:我有一些文本挖掘工具,只能处理ASCII字符串。大部分应该处理的文本都是英文的,但有些文件包含非ASCII字符。我对这些单词不感兴趣,但我必须确定,我感兴趣的单词(那些只包含ASCII字符的单词)在字符串转换后处于相同的位置。
你打算把口水鸡换成什么?我不知道如何用三个字母表达唾液鸡的概念。 – novalis 2010-01-19 20:12:22
目前尚不清楚 - 您是否尝试保留字符数或字节数......或者显示时字符串的宽度? – MtnViewMark 2010-01-19 20:36:49
@novalis +1唾液鸡:-) – 2010-01-19 20:51:03