2011-04-11 33 views
0

此链接的元描述:http://www.mercurynews.com/samesexmarriage/ci_17794445?source=most_viewed&nclick_check=1元数据未解码PHP

返回的是一个奇怪的字符而不是引号。

The federal judge who struck down Californias gay marriage ban has confirmed that hes gay. Chief U. 

我使用strip_tags(html_entity_decode(htmlspecialchars_decode($description, ENT_NOQUOTES), ENT_NOQUOTES, "UTF-8"));

什么办法呢?怪异的字符出现在地方报价的单词“加州”和“他”

回答

1

该网站是不正确编码的HTML实体。在源那些撇号应编码为' - 为对撇号(十进制数39)的十六进制数的实体。他们使用,这对ASCII“逃亡”字符的十进制数的实体。

您可以通过添加一个str_replace电话支付他们的错误很容易地:

$description = str_replace('', "'", $description); 
$description = strip_tags(html_entity_decode(htmlspecialchars_decode($description, ENT_NOQUOTES), ENT_NOQUOTES, "UTF-8")); 

Reference for ASCII codes