2010-08-16 353 views
1

我一直在寻找(失败)的方式来打开PDF文件并从中获取书签。我已经查看了大多数PHP库的PDF,但他们似乎专注于创作,而不是阅读。如何使用PHP读取PDF书签?

在这一点上,我会很高兴与任何语言的解决方案,所以它不是PHP,但它会很好。

谢谢!

+0

自发布以来,我碰到了pyPdf。它在阅读pdf方面做得很好,但获取命名目的地和轮廓的功能对我来说似乎没有多大作用。 – 2010-08-16 19:18:00

+0

pdftk及其“dump_data”最适合我。从PHP使用exec()https://www.pdflabs.com/docs/pdftk-cli-examples/ – Teson 2016-08-09 09:42:20

回答

1

如果一切都失败了,你可以尝试解析PDF来提取书签信息,尽管确切地说它在哪里以及它看起来像什么,我没有模糊。在它的核心,PDF只是一个Postscript文件,一旦你过滤掉了所有的二进制垃圾(字体定义,图像等等),你就得到了一堆纯文本的Potscript代码。

+0

这就是我已经辞职自己去做。我找到了包含书签的文件的一部分,所以我只是试着将它们解析出来。谢谢! – 2010-08-17 12:54:09

1

你可能想通过PDFLib来看看在“的pCOS”库:

http://www.pdflib.com/products/pcos/

它能够从现有的PDF文件,包括书签提取的各种信息,它是可作为PHP扩展。这不是免费软件,根据操作系统的不同,单台服务器的价格为245美元(195欧元)或更多。 (我与供应商没有任何关系)。