我正在创建一个类来打开网页并存储页面上所有出站链接的href值。由于某种原因,它适用于前3然后变得更加奇怪。以下是我的代码:strpos问题:获得价值UBLIC返回
class Crawler {
var $url;
function construct($url) {
$this->url = 'http://'.$url;
$this->crawl();
}
function crawl() {
$str = file_get_contents($this->url);
$start = 0;
for($i=0; $i<10; $i++) {
$beg = strpos($str, '<a href="http://',$start)+16;
$end = strpos($str,'"',$beg);
$diff = $end - $beg;
$links[$i] = substr($str,$beg, $diff);
$start = $start + $beg;
}
print_r($links);
}
}
$crawler = new Crawler;
$crawler->construct('www.yahoo.com');
忽略for循环暂时我知道这只会返回前10个,不会执行整个文档。但是如果你运行这个代码,前3个工作正常,但其他所有值都是UBLIC。 任何人都可以帮忙吗?由于