2010-11-11 112 views
2

我需要为网站开发人员/设计人员进行编辑,他让我打印所有网页并直接对其进行评论。如何将网站中的所有网页转换为pdf?

虽然从数据库中可以自动生成数千个数据库,但我们要编辑的数据大约有35个,但这些数据按顺序编号。因此,我只想在地址中下载索引为1的页面,例如,

如果有我可以使用的bash解决方案,但是Ruby也可以工作 - 该站点写入红宝石,而且开发人员对ruby和bash以及其他一些语言都很好 - 所以如果你能提出一些建议让我们开始,那会很棒。

我想打印在除server.com/目录中的所有页面,如果页面被记录索引,那些具有指数> 1:

  • server.com/records/
  • 服务器。 COM /记录/ 1
  • server.com/records/1/new

但不

  • server.com/records/2
  • server.com/records/2/new

或有任何页面?在他们像

  • server.com/records?letter=K

和等

有没有办法,我可以的所有网页转换为PDF一个简单的,自动化的方式?

+0

为什么不只是做手工好Railcasts?在浏览器中打开标签页中的所有页面,并打印成PDF格式。这可能花了你更长的时间在这里问你的问题:) – 2010-11-11 20:39:26

+0

这就是我第一次做了什么...你是对的,它可能需要更长的时间,但另一个好处是能够并入最新数据库文档文件中的页面快照(自动从latex中获取) – 2010-11-11 20:44:11

回答

0

wkhtmltopdf是一个很好的工具,它很好地工作在Ubuntu

wkhtmltopdf www.google.com foo.pdf 
xpdf foo.pdf