2017-02-28 44 views
-1

我有一个PHP网络爬行器来解析提到的网站的选择性陈述。调用图书馆(guzzle)的PHP网络爬虫?

它工作正常,但是当我添加了一个while循环它来分析网站的多个网页,就来到了错误的Warning: require_once(github.com/guzzle/guzzle): failed to open stream: No such file or directory

我没有从https://github.com/guzzle/guzzle 下载狂饮文件夹,但似乎仍像正确识别在我的脚本中没有正确完成;

我的脚本去为:

<?php 
    $i = 1; 
    while(true){ 
    require_once('github.com/guzzle/guzzle'); 
    $subject = file_get_html('http://www.usmleforum.com/forum/index.php?forum=1&Page='+$i); 
    preg_match_all('/<td.+?FootNotes2.+?<a.+?<\/a> - (?P<name>.*?)<\/td>.+?<td.+?FootNotes2.+?(?P<date>\d{2}\/\d{2}\/\d{2} \d{2}:\d{2})/siu', $subject, $matchs); 

    foreach ($matchs['name'] as $v){ 
    echo $v. " "; 
    } 
    foreach ($matchs['date'] as $v){ 
    echo $v. " "; 
    } 
    } 
    $i++; 
?> 

究竟应该返回是打印与标签名称和文本日期在网站的所有网页上的文字,

任何帮助表示赞赏..

回答

0

尝试重命名文件夹或将文件放在最短路径。而require_once()是要求文件夹不

+0

我应该将文件夹命名 ? – harishk

+0

就像你想要的,但require_once只对文件(http://php.net/manual/en/function.require-once.php) –

+0

我其实工作相同的代码没有'require_once或guzzle'和'而loop',它工作得很好..但后来我加入while循环从所有网页获得的数据,那么它显示一个错误,所以朋友建议加这个东西狂饮..我很新的这一点?\ – harishk