0
我正在尝试将html编码文本转换为utf-8以将其放入我的数据库。 有很多字符会被html_entity_decode或iconv与Translit一起遗漏。html_entity_decode characters like Yuml vs&yuml
我已经写了字的长列表来剔除,但现在我看到& Yuml不被翻译,但& yuml是。
我相信还有其他类似的符号也错过了。
关于如何最好地处理这些不一致的建议?并确保我得到每个字符翻译正确?
谢谢德罗伯特, 我希望有一种方法可以做到这一点,而不会经历这么长的列表(希望已经存在的东西)。 看起来我会为此做些清洁工作,我会在未来为那些需要它的人发布功能。 – pedalpete 2009-08-19 18:25:07