2008-11-09 191 views
20

如何使用Python将PDF文件转换为HTML?使用Python将PDF转换为HTML

我一直在思考Google为索引PDF文件所做的工作(或似乎是做了什么)。

我最终的目标是设置Apache来显示PDF文件的HTML,所以任何引导我朝这个方向发展的东西都会被赞赏。

回答

5

poppler包提供了一个您可能可以使用的pdf2html实用程序。 libpoppler还有一个Python binding

+0

python绑定主要是用于在GTK widget/ui中渲染PDF,所以我不确定这会对此有所帮助。 – 2008-11-09 21:40:56