我试图检测字符串的字符编码,但我无法得到正确的结果。
例如:在PHP中检测正确的字符编码?
$str = "€ ‚ ƒ „ …" ;
$str = mb_convert_encoding($str, 'Windows-1252' ,'HTML-ENTITIES') ;
// Now $str should be a Windows-1252-encoded string.
// Let's detect its encoding:
echo mb_detect_encoding($str,'Windows-1252, ISO-8859-1, UTF-8') ;
即代码输出ISO-8859-1
但它应该是Windows-1252
。
这是怎么回事?
编辑:
更新的示例,以回应@ raina77ow。
$str = "€‚ƒ„…" ; // no white-spaces
$str = mb_convert_encoding($str, 'Windows-1252' ,'HTML-ENTITIES') ;
$str = "Hello $str" ; // let's add some ascii characters
echo mb_detect_encoding($str,'Windows-1252, ISO-8859-1, UTF-8') ;
我再次得到错误的结果。
什么是您使用的PHP版本?它在这里显示正确http://codepad.viper-7.com/NfvdWm。顺便说一句,你应该总是首先列出UTF-8,因为它是最受限制的。可能根本不需要ISO-8859-1,因为任何东西都是有效的ISO-8859-1。 – Esailija 2013-04-06 09:25:55
@Esailija,你没有使用问题中任何两个例子的代码。试试这两个例子中的任何一个,你就会得到结果'ISO-8859-1'。 – GetFree 2013-04-07 01:17:10