2017-04-09 74 views
0

从Tumblr博客下载所有图像/ webms/mp4s的最佳方式是什么?从Tumblr博客下载所有超链接的URL?

我期待一些的tumblr博客下载所有文章/图像/视频,并且他们中的超链接后的身体,这Tumblripper/BulkImageDownloader /其他的tumblr图像下载者不抓gfycat/WEBM版本。我认为这是一个问题,因为它们在体内超链接,而不是实际上“在”Tumblr上。

任何人都知道一个很好的解决方案,从Tumblr博客下载所有内容?我也尝试过wget和httrack,但他们似乎没有工作。

我宁愿使用带GUI的程序来做我需要做的事情,而不是基于命令的程序,因为我几乎不知道如何工作。我花了很长时间才弄清楚wget,而且我没有时间去学习另一个下载Tumblr博客。

回答

0

我明白,你是反对的命令行工具,但我会personnally使用curl编写网页的源文件:

curl www.tumblr.com/something > outfile.html 

然后你就可以分析在您习惯使用什么语言文件。 这个答案对如何做一些很好的建议,使用grep: https://unix.stackexchange.com/questions/181254/how-to-use-grep-and-cut-in-script-to-obtain-website-urls-from-an-html-file

像这样的:

$ curl -sL https://www.google.com | grep -Po '(?<=href=")[^"]*(?=")' 
/search? 

它给你:

https://www.google.co.in/imghp?hl=en&tab=wi 
https://maps.google.co.in/maps?hl=en&tab=wl 
https://play.google.com/?hl=en&tab=w8 
https://www.youtube.com/?gl=IN&tab=w1 
https://news.google.co.in/nwshp?hl=en&tab=wn 
...