我有一个网站,我需要解析它。解析网址,循环file_get_html(网址),然后获取元素
首先,我必须解析页面中的所有目录的URL,然后我需要输入所有的URL,然后遍历所有的URL并再次解析每个页面上的URL,然后遍历所有的URL并获取元素('.description DIV')。
我使用简单的html dom。
但我有一个问题,当我想要浏览所有我第一次解析的网址时。 我得到空页
include 'simple_html_dom.php';
$catalogs = file_get_html('http://optnow.ru/catalog');
$catalogLink = [];
if(!empty($catalogs)) {
foreach($catalogs->find('div.cat-name a') as $catalog) {
$catalogUrl = 'http://optnow.ru/' . $catalog->href . '?page=0';
$catalogLink[] = $catalogUrl;
$catalogHtml = file_get_html($catalogUrl);
$productsLink = $catalogHtml->find('.link-pv-name');
print_r($productsLink->href);
}
}
我的错误在哪里?
感谢。
'$ catalogLink [0] $ catalogSingleLink' – mehulmpt