2010-06-16 72 views
0

我开始一个项目,并想知道图像中的字符与图像所在的整个网页之间的关系。抓取图像,整个网页并缓存它们

我想抓取一些图像及其网页。我需要将抓取结果保存在本地磁盘中以供进一步分析。我想知道这个问题是否有开放源代码?

+0

我知道这是一个古老的线程,但图像爬行合法吗?我想从网站上使用一些抓取的图像,这些图像具有可访问和可下载的图像,因此不会使用“黑客”来获取图像。该网站在图片上也没有版权标记。我可以重用这些图像吗? – Coder 2016-03-23 12:55:59

回答

0

您可以使用crawler4j用于此目的。这是一个简单的Java爬虫程序,可以在几分钟内配置,并且您还可以将它用于爬取图像。您还可以在源代码中找到ImageCrawler示例。