2013-03-08 204 views
3

我想下载远程服务器上的文件夹中的所有文件,我使用wget Windows客户机上我的命令是:如何解决与wget空index.html问题?

>wget -r http://www.example.com/getfeed/d165161dasdvc561551as1v6/soccerfixtures/england/ 

此行给我的index.html大小(0 KB)。

然后我用:

>wget -r --reject "index.html*" http://www.example.com/getfeed/d165161dasdvc561551as1v6/soccerfixtures/england/ 

现在我没有得到任何文件,甚至当我排除的index.html我还没有得到下载可能有人帮助我,告诉我为什么任何文件?

回答

1

这只有在另一端的Web服务器配置为给您一个目录列表时才有效。并非所有的服务器都是这样配置的。大多数会自动将您重定向到您要求wget忽略的index.html,index.php等。

在第一种情况下,如果您不忽略index.html,wget将仅在该页面中的链接之后。由于Web服务器返回的index.html的大小为零,因此wget没有链接,它会终止。 Wget没有办法明确知道目录中的文件。

编辑处理意见:

$ wget的-i下载文件LIST.TXT

+0

首先我在每个目录中的文件列表,并尝试下载一个文件,并将其与工作Wget,但现在我的问题是,我在differenet目录中有超过300个XML文件,我想用Wget下载它们,难道还有做脚本的吗?我需要知道什么是最好的方式,最好的语言,如果需要很长时间,远程服务器是否可以阻止该进程? – 2013-03-09 07:37:28

+0

查看我添加到我的答案中的修改。这听起来有点像你在问什么。 – 2013-03-10 02:34:59