pyPdf是一个伟大的库分裂,合并PDF文件。 我正在使用它将pdf文档分成1页文档。 pyPdf是纯粹的python,并且在保存提取页面时,在PdfFileWriter对象的_sweepIndirectReferences()方法中花费了大量时间。我需要更好的表现。我试过使用多线程,但由于大部分时间都用在python代码中,因为GIL(它实际上运行速度较慢)没有速度增益。快速PDF分割器库
是否有任何用c编写的库提供相同的功能?或没有人有一个好主意,如何提高性能(除了产生一个新的过程,我想分裂每个PDF文件)
在此先感谢您。
跟进。 链接到一对夫妇的命令行的解决方案,能够证明有时比pyPDF快:
- http://multivalent.sourceforge.net/Tools/pdf/Split.html
- http://www.linuxsolutions.fr/how-to-extract-pages-from-a-pdf/
我修改pyPDF PdfWriter类跟踪多少时间已经花在_sweepIndirectReferences()方法上。如果它太长了(现在我使用3秒的魔法值),那么我通过从python调用它来恢复使用ghostscript。
感谢您的答案。 (codelogic的xpdf引用是让我寻找不同的方法的那个)
我需要反汇编pdf。如果我理解正确mbtPdfAsm汇编pdfs。 – Nathan 2009-02-03 19:07:03
它可以用于组装和拆卸PDF文件。 – codelogic 2009-02-03 19:26:33