2
如果有其他类写入这样做,一个链接将是非常棒的。如果不是,我怎么用PHPCrawl做到这一点?PHP的网络爬虫,数据结构和存储,它会与PHPCrawl?
是否可以根据特定于网站的一组规则存储来自已爬网站点的特定信息?例如,[div.wantThis, img#defaultPicture]
是网站A返回的数组,只有[div.shortTextContent]
是网站B返回的数组?
在PHPCrawl中,我如何从$page_data
数组中获取这些信息?
需要
必须能够只针对某些元素。
能够从变量(可能是指定要定向的元素的数组)中读取数据存储规则。