2008-12-10 80 views
9

我试图使用wget递归地从特定网站抓取.jpg文件,以期为我自己创建一个有趣的屏幕保护程序。真的不是这样一个崇高的目标。“wget --domains”没有帮助..我做错了什么?

问题是,图片托管在其他地方(mfrost.typepad.com),而不是网站的主域(www.cuteoverload.com)。

我曾尝试使用“-D”来指定允许的域名,但可悲的是没有可爱的jpgs即将出现。我怎么能改变下面的线来完成这项工作?

wget -r -l2 -np -w1 -D www.cuteoverload.com,mfrost.typepad.com -A.jpg -R.html.php.gif www.cuteoverload.com/ 

谢谢。

+0

`-np` /`--no-parent`和`-D` /`--domains`似乎不适合我,我安装了wget`1.12`后安装了wget`1.16`命令返回不同的结果,现在域限制起作用。我的完整命令包含这些附加选项:`-m -E -k -np`。 – adrianTNT 2015-10-28 12:03:19

回答

12

wget的的页面[1]人的检查说,这大约-D:要遵循

组域。 domain-list是逗号分隔的域列表。请注意,它不打开-H。

此通报有关-H看起来很有趣:

启用做递归检索时,各主机间跨越。

所以你只需要在你的调用中添加-H标志。

(这样做之后,貌似所有图像都被限制在 mfrost.typepad.com/cute_overload/images/2008/12/07 mfrost.typepad.com/cute_overload/images/2008/12/ 08)。

- [1]虽然 wget的主要参考手册是信息格式。

相关问题