我需要从网页上显示一些消息,所以我需要从网站提取数据。但我无法提取数据,如下面的代码:如何从网页上抓取数据?
$html=file_get_html("http://listverse.com/2014/12/01/10-times-us-foreign-policy-was-wildly-inconsistent/");
foreach($html->find('article h2') as $element)
{
echo "<h2>".$element->plaintext."</h2>"."<br>";
foreach ($html->find('article h2 p') as $element1) {
echo "<pre>";print_r($element1->plaintext);
}
但我得到正确的标题,但每个段落是多余的。
这实际上是一个肮脏的方法从该新闻网站获取数据。当您查看源代码时,您会看到有一个.rss提要。你为什么不用它来获取数据? 例如:http://listverse.com/feed/ 而您的帖子特定的一个: http://listverse.com/2014/12/01/10-times-us-foreign-policy-was -wildly-inconsistent/feed/ – Duikboot 2014-12-02 12:50:54
rss没有完整的详细信息 – kavita 2014-12-02 12:58:53
请注意,复制另一个网站的新闻并重新发布它可能会违反版权。 – Quentin 2014-12-02 13:00:18