2011-11-16 77 views
0

我试图抓住http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA的表格,并将其存储到我的服务器上的MySQL数据库中。使用下面,我能够完全复制网站,但我不知道如何提取该表。代码如下:从NHL.com上刮去数据

任何想法?

function get_data($url) 
{ 
    $ch = curl_init(); 
    $timeout = 5; 
    curl_setopt($ch,CURLOPT_URL,$url); 
    curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); 
    curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout); 
    $data = curl_exec($ch); 
    curl_close($ch); 
    return $data; 
} 

$returned_content = get_data('http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA'); 

echo $returned_content; 

UPDATE:

$html = file_get_html('http://www.nhl.com/ice/standings.htm?season=20112012&type=LEA'); 
    $e = $html->find("table", 2); 

    echo($e); 

此代码的工作,职位像我需要一个表。但是现在我很好奇我会如何去除所有不必要的链接/格式并将其保存到数据库中?

+0

对不起,这是PHP。 – jsquadrilla

+0

这可能是针对他们的服务条款。公司为这些数据提供Web服务和API提供了大量资金。 –

回答

0
+0

试过了。就像我用cURL做的那样,没有任何地方靠近。这很难,因为我无法找到一个体面的教程来开始使用,即使我想要做的事情是先进的。 – jsquadrilla

0

工作在谷歌电子表格,我所有的importhtml功能nhl.com今年不工作。我认为他们是(出于某种原因)阻止用户抓取他们的数据。