0
我试图抓取这个页面右边的最后一个表格http://anonym.to/?https://vircurex.com/并抓取所有数据并打印出来。问题是所有这些表用户相同的样式和类名,所以我不知道如何获得该特定的表。DOM Scraping This Page For Specific Table
我试图抓取这个页面右边的最后一个表格http://anonym.to/?https://vircurex.com/并抓取所有数据并打印出来。问题是所有这些表用户相同的样式和类名,所以我不知道如何获得该特定的表。DOM Scraping This Page For Specific Table
我有一个功能,我用它来得到任何给定元素的innerHTML:
function InnerHtml($element)
{
$innerHTML = "";
if($element != NULL && $element->hasChildNodes())
{
$children = $element->childNodes;
foreach ($children as $child)
{
$tmp_dom = new DOMDocument();
$tmp_dom->appendChild($tmp_dom->importNode($child, true));
$innerHTML.=trim($tmp_dom->saveHTML());
}
}
return $innerHTML;
}
如果查询表
$dom_document = new DOMDocument();
@$dom_document->loadHTML("Your Page - However you have decided to download it");
$table = $dom_document->query("table[class='MyList]'");
然后,您应该能够只是通过最后一个在列表中:
enter code here
echo InnerHtml($ table-> item(count($ table)-1));
我还没有测试过,但它基本上是你的后。
看到这篇文章:http://stackoverflow.com/questions/4026330/extract-html-of-a-scraped-page-using-phps-dom?rq=1 – Revent 2013-05-07 22:11:45