我想刮阿拉伯语的网页和一切工作正常,但事实上,当我回显文本我得到的是一个乱码文本,即使我已设置标题UTF-8设置Utf8不工作在阿拉伯语文字在PHP
这里是我的代码
<?php
header ('Content-Type: text/html; charset=UTF-8');
require 'vendor/autoload.php';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'http://www.lebanonfiles.com');
$news_container = $crawler->filter('#mcs4_container .line');
$news_container->each(function($node) {
echo $node->text();
})
?>
设置元标题并不总是足够的。 →Apache发送什么头文件? →您的浏览器/页面检测在现实中表现如何? →如果将输出存储到文件并使用UTF-8编辑器打开,会发生什么情况? →Goutte是否正确[解压缩为UTF-8](http://stackoverflow.com/questions/18782332/can-goutte-guzzle-be-forced-into-utf-8-mode)? →另外一个截图转储不是很有用。至少使它成为一个hexdump。 →通过比较期望的UTF-8序列和Unicode表格等,提供一点自己的研究。 – mario
尝试在HTML和PHP中设置字符集。它可能有帮助。 –
这可能对你有帮助,[Force Goutte/Guzzle进入UTF-8模式](http://stackoverflow.com/questions/18782332/can-goutte-guzzle-be-forced-into-utf-8-mode) –