2009-06-10 151 views
2

我的任务是为了合法的目的截取一组网页的截图。我目前正在通过使用Webshot并使用我自己编译的URL列表来运行批处理操作来完成此操作。我还必须截取使用IECapt及其延迟功能完成的旋转Flash横幅的屏幕截图。如何抓取网站并截取每个网页的截图?

每个页面都有一系列需要截取所导致页面截图的广告。如何自动执行此操作,以便在链接之后不会花费数小时点击每个链接?

如果不清楚,主页有4个辅助广告链接到4个不同的产品页面。我需要首页(完成)的屏幕截图,然后是广告链接页面的四个不同屏幕截图。

哦,使事情变得有趣,在主页上使用JavaScript重定向一拉:

javascript:dcsOnsiteAdLink('url', '/whyjoin', 'ad', 'S1', 'popup', 'toolbar=yes,location=yes,directories=yes,status=yes,menubar=yes,scrollbars=yes,resizable=yes,width=780,height=500'); 

回答

5

的gnome-Web的照片使用GEKO引擎渲染,并采取了网页的快照。这是相当漂亮和脚本。

7

通过Elance或Mechanical Turk向您支付3美元/小时的费用。即使你只花费4个小时来剽窃剧本,花费的代价也不过是花几块钱买下它。

+0

这是不理想的,因为作为一个开发者,我可能会管理,有很多依赖关系的网站,我希望能够迅速释放。我建议尝试许多卡斯珀脚本已经为此或这个:https://www.npmjs.com/package/crawl – jasongonzales 2016-05-25 22:56:16

3

Adob​​e Acrobat Pro在这方面很不错。它可以抓取整个网站并将其制作为单个索引文档。屏幕截图只会让你看到屏幕上的内容,Acrobat Pro可以让你看到整个页面。