我有以下字符。将拉丁字符转换为Java中的普通文本
一个¢¥ŚŠŞŤŹŽŻąľśšşťźžżÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõöøùúûüýþÿ
我需要转换为
AcYSSSTZZZalssstzzzAAAAAAACEEEEIIIIDNOOOOOOUUUUYTSaaaaaaaceeeeiiiionoooooouuuuyty
我使用Java 1.4。
Normalizer.decompose(text,true,0).replaceAll( “\ p {InCombiningDiacriticalMarks} +”,“”);只用符号替换字符。
类似¢ÆÐÞßæðøþ的字符没有被转换。
我该怎么做,在JDK 1.4中进行转换的有效方法是什么?
请帮忙。
问候, 诗丽黛玮·阿雅潘
Y并不等于¥ - 考虑¥意味着“元”。你可能需要实现一个查找表,因为@ stephen -c建议 – Deco 2012-04-17 09:37:35
我需要帮助来形成查找表并从查找表中获取等效字符。我可能不希望查找表包含¥,我可能想存储unicode等价物并将其转换为Y. – 2012-04-17 09:40:26
与@Deco同意,只是添加到主题中,我不认为ß等价于S或者......至少在德语中它相当于SS,将“Strasse”替换为“Strasse”而不是“Strasse”就是错误的。 – Fredrik 2012-04-17 09:43:59