2012-08-26 20 views
0

我有以下链接列表。如何从网页中获得链接php

<tr><td><a href="javascript:d(43755)"> Microsoft office 2010 professional plus </a></td><td> 2012-04-09 </td><td align="right"> 28% </td></tr> 
<tr><td><a href="javascript:d(43742)"> Microsoft Office 2010 all versions </a></td><td> 2010-11-03 </td><td align="right"> 63% </td></tr> 
<tr><td><a href="javascript:d(43747)"> Microsoft Office 2010 Home and student </a></td><td> 2012-05-10 </td><td align="right"> 51% </td></tr> 

有没有办法让在链接的JavaScript所有的数字:在另一个数组的数组和日期d(数字)?

+1

我推荐一个DOM解析器。 – Brad

回答

2
$input = '<tr>...........YOU PAGE HERE'; 
$result = array(); // your result array 
preg_match_all('/d\((\d+)\).*?(\d{4}-\d{2}-\d{2})/', $input, $result, PREG_PATTERN_ORDER); 
$numbers = $result[1]; // your numbers 
$dates = $reult[2]; // your dates 
+0

如果你想获取特定页面的内容(然后提取信息) - > $ input = file_get_contents('http://www.google.de'); – TheHe

+0

当fopen-url-wrappers被允许而不是激发卷曲时,它会更容易。 – TheHe

3

我会使用一个DOM解析器。如果您熟悉CuRL,可以用很少的代码完成。您可以通过页面进行分析,查找所有链接并从中获取所需的任何信息。

这里是卷曲的优秀导游:curl tutorial