2016-07-29 60 views
2

PHP:我解析了一些使用Simple Html Dom Parser的页面,我已经完成了很多工作,但一直处于困境。PHP简单的HTML DOM:如何在JavaScript中找到Url存在

如何获取驻留在javascript函数中的url。 (网址是随机的)像这样

<script> 
    lstImages = array(); 
    lstImages.push("abc.com/123873.php"); 
    lstImages.push("abc.com/125673.php"); 
</script> 

我该如何得到它们?它们可以随机计数,有些页面有20个,大约25个等等。

帮助将不胜感激,我已经用尽了这件事。

示例代码:

require "simple_html_dom.php"; 
$html = file_get_html('pages.html'); 

$file = fopen("links.txt","w"); 
foreach($html->find('a') as $link) { 
    echo fwrite($file,$link->href."\n"); 
} 
+0

你能提供你正在刮的HTML吗? – Milkmannetje

+0

当然这里是pastebin [链接](http://pastebin.com/tfrF3g3p) –

回答

2

既然你不能使用DOM解析器刮JavaScript,您可以使用正则表达式做到这一点。

使用此:

$html = file_get_html('pages.html'); 

$re = "/push\\(\"(.*)\"\\)/"; 
$str = $html; 

preg_match_all($re, $str, $matches); 

$匹配现在包含您的URL的数组。

+1

令人惊讶的是,伎俩。 [这里是输出](http://i.imgur.com/UNfKli9.png)谢谢。 –