2010-03-08 95 views

回答

3

谷歌pdf2html,pdftohtml看起来是唯一可行的。它基于一个命令行程序,而不是PHP。所以它可能对你没有用处。谷歌有能力进行转换,所以也可以通过GDocs来实现。尽管我不确定这一点。无论如何,我希望这至少能让你走上正确的道路。

+0

我不知道PHP,但大概你可以执行/从PHP内部调用shell脚本(并捕获输出),所以这可能会工作 – 2010-03-08 17:12:29

+0

绝对可以做到这一点,这就是为什么我把它提出来,我不确定谷歌会让他轻松做他想做的事情。 – 2010-03-08 20:41:39

+0

优秀的解决方案,谢谢! – 2010-03-10 11:17:49

0

你不能。

PDF是包含嵌入字体,矢量图形和布局信息的复杂文档,无法用HTML自动表示。您可能能够提取文档的TEXT,但这就是它。

1

我试过Poppler的pdftohtml命令将PDF文件转换为HTML文件。 Check it out on Poppler的HTML文件输出在使用时较亮,但输出不太准确。

如果你想准确输出你应该use pdf2htmlEX我已经转换复杂的PDF文件,并得到最好的HTML输出。