基本上在网页上有一个目录列表,每个目录都有更多的子目录。子目录包含许多文件,我想从我的Linux机器上的一个位置下载一个文件,每个子文件夹中都有特定的序列号'RMD'。wget:下载目录/子目录中的所有文件
例如,说主目录链接到目录dir1,dir2,dir3 ...,并且每个目录都有子目录dir1a,dir1b ...,dir2a,dir2b ...等。我想要下载形式:
webpage/dir1/dir1a/file321RMD210
webpage/dir1/dir1b/file951RMD339
...
webpage/dir2/dir2a/file416RMD712
webpage/dir2/dir2b/file712RMD521
目录/子目录未按顺序在上面的例子中编号一样(这只是我使它更易于阅读),那么有没有一个终端命令,将递归遍历每个目录和子目录,并下载每个文件的文件名中都带有字母'RMD'?
该网站的问题是:here
我希望这是足够的信息。
是有一个目录列表在网站上?或者它只是文件夹中的文件?如果没有公开列表,则无法知道存在哪些文件。如果有文件列表,你需要做一些事情来获取这个列表,提取每个网址,访问它们,提取每个网址......等等。你肯定有一些工具可以在网上找到从某个网址抓取网站可能会这样做,但我无法命名或推荐任何。 –
我已经添加了主帖的网站链接。我可以手动转到每个目录/子目录并下载每个文件,但这需要很长时间。另外,知道如何自动为将来做这件事会很有用。 –