0
我成功使用cURL和HTTP从远程服务器下载文件,但该文件包含所有HTML代码。HOWTO使用cURL和HTTP从HTML/XML中提取特定文本
在cURL中是否有一个函数,以便我可以提取我想要的值?
例如,我得到:
...
<body>
Hello,Manu
</body>
...
但我只想Hello,Manu
。
由于提前,
马努
我成功使用cURL和HTTP从远程服务器下载文件,但该文件包含所有HTML代码。HOWTO使用cURL和HTTP从HTML/XML中提取特定文本
在cURL中是否有一个函数,以便我可以提取我想要的值?
例如,我得到:
...
<body>
Hello,Manu
</body>
...
但我只想Hello,Manu
。
由于提前,
马努
尝试使用DOMDocument或任何其他的XML解析器。
$doc= new DOMDocument();
$doc->loadHTML($html_content); // result from curl
$xpath= new DOMXPath($doc);
echo $xpath->query('//body')->item(0)->nodeValue;
或者命令行,你可以使用
curl 'http://.................' | xpath '//body'
是否使用卷曲在命令行或在其他语言的库 – Robb 2011-06-09 10:07:05