2017-02-17 130 views

回答

0

这是行不通的,因为大多数Web服务器都禁用了目录列表。 无法抓取每个页面。但是,您可以抓取主页面上链接的每个子页面。例如,您可以创建一个在该网站上找到的所有链接的数组,并过滤​​具有相同域名的链接。但是这不会找到没有链接到任何地方的目录。