pypdf

    0热度

    1回答

    我已经得到pypdf工作就好了一个单一的PDF文件,但我似乎无法让它工作的文件,或for循环多个pdf文件,没有失败,因为的字符串不可调用。任何想法我都可以用作解决方法? def getPDFContent(path): content = "" # Load PDF into pyPDF pdf = pyPdf.PdfFileReader(file(path, "r

    4热度

    1回答

    我想在pdf的每个页面上显示一个文本。这个文本是一个看起来像<p style="color: #ff0000">blabla</p>的html代码,它在最终文档中显示为红色,我将它转换为pdf(html2pdf lib),然后将它合并(PyPDF2 lib)到我的pdf的每个页面。 ...但合并非常缓慢! 我的问题是: 是否有合并PDF比PyPDF2的page.mergePage方法更快的方法?

    3热度

    4回答

    我想写一个程序在Python中,需要一个PDF文件,并附加到它第一个任何pdf,其中包括一个水果的名称(芒果,橙或苹果) ,然后将pdf的动物名称附加到原始文件(斑马,猴子,狗),最后附加任何剩余的PDF。这是我的代码: import os from PyPDF2 import PdfFileReader, PdfFileMerger originalFile="C:/originalFil

    2热度

    1回答

    我已成功安装pyPDF,但extractText方法并不能很好的工作,所以我决定尝试pyPDF2,问题是,提取文本时,有一个例外: Traceback (most recent call last): File "C:\Users\Asus\Desktop\pfdtest.py", line 44, in <module> test2() File "C:\Users

    0热度

    1回答

    我尝试使用PyPDF2将2个PDF页面合并为一个。 这里PDF示例文件http://ge.tt/9IvaIo01 但是,当我尝试合并,我recive每一页的副本,从顶部和底部。 这里的示例演示何时使用第0页和第1页上的mergeTranslatedPage,您将收回第2页和第1页上的非副本。 也许是我的错或误解。谢谢。 from PyPDF2 import PdfFileReader,PdfFil

    0热度

    1回答

    了pyPDF2 LIB跑这里例如: https://github.com/mstamy2/PyPDF2/tree/Python3-3 当试图运行脚本“示例1:”从那里看到: PyPDF2 python versions (2.5 - 3.3) compatibility branch Traceback (most recent call last): File "1.py", l

    1热度

    1回答

    我有打破pyPdf PDF文件:http://tovotu.de/tests/test.pdf 这是示例脚本: from pyPdf import PdfFileWriter, PdfFileReader outputPdf = PdfFileWriter() inpdf = open("test.pdf","rb") inputPdf = PdfFileReader(inpdf) [

    1热度

    1回答

    我使用pypdf从pdf文件中提取文本。问题是没有提取PDF文件中的表格。我也尝试使用pdfminer,但我有同样的问题。

    5热度

    2回答

    我想解析PDF文件使用pdfMiner,但提取的文本得到合并。我正在使用以下链接中的pdf文件。 PDF File 我好与任何类型的输出(文件/串)。下面是代码,它将提取的文本作为字符串返回给我,但由于某些原因,列被合并。 from pdfminer.converter import TextConverter from pdfminer.layout import LAParams from

    1热度

    2回答

    我试图从PDF中提取文本,以便我可以分析它,但是当我尝试从页面中提取文本时,我收到以下错误。 Traceback (most recent call last): File "C:\Program Files (x86)\eclipse\plugins\org.python.pydev_2.7.4.2013051601\pysrc\pydevd_comm.py", line 765, in do