抓取图像，整个网页并缓存它们

我开始一个项目，并想知道图像中的字符与图像所在的整个网页之间的关系。抓取图像，整个网页并缓存它们

我想抓取一些图像及其网页。我需要将抓取结果保存在本地磁盘中以供进一步分析。我想知道这个问题是否有开放源代码？

2010-06-16 Kei Situ

我知道这是一个古老的线程，但图像爬行合法吗？我想从网站上使用一些抓取的图像，这些图像具有可访问和可下载的图像，因此不会使用“黑客”来获取图像。该网站在图片上也没有版权标记。我可以重用这些图像吗？ – Coder 2016-03-23 12:55:59

靠近列表顶部的列表是Java爬虫，和维基百科的文章有一些更多的，以及

2010-06-16 10:16:03

您可以使用crawler4j用于此目的。这是一个简单的Java爬虫程序，可以在几分钟内配置，并且您还可以将它用于爬取图像。您还可以在源代码中找到ImageCrawler示例。

2010-07-29 08:25:47 Yasser

回答