pypdf

    1热度

    4回答

    我正在使用的代码采用.pdf文件,并输出.txt文件。我的问题是,如何创建一个循环(可能是一个for循环),它以一个以.pdf结尾的文件夹中的所有文件一遍又一遍地运行代码?此外,我怎么每次循环运行时改变输出,这样我可以每次都具有相同的名称作为输入文件(即1_pet.pdf> 1_pet.txt,2_pet.pdf> 2_pet写一个新的文件。 TXT等) 这里是到目前为止的代码: path="2_

    0热度

    1回答

    我试图用PdfFileReader从pyPdf模块打开PDF(名为kalimera.pdf),使用下面的命令集 from pyPdf import PdfFileReader, PdfFileWriter document = PdfFileReader(open('kalimera.pdf', 'rb')) 我得到以下错误: Traceback (most recent call last

    0热度

    1回答

    在Python中使用XHTMLPDF2;伟大的工具!我要生成PDF以集成到另一个PDF中,所以我需要第一个页面从顶部的某个高度开始(例如,有时是432pt,其他位置是200pt;它是在一个变量中)。 但是之后的每一页都应该从最上面开始。 我试过这个CSS,和它的作品就像我想让它......除了第二页及以后写在第一个开始,你会得到原来的第一页的这个网与第二页面从第一页开始。其他每页都很好。 这里是我

    -1热度

    1回答

    我正在写一个脚本,它将读取pdf文件的创建和修改日期。我使用pyPdf包在Python 我有以下代码 from pyPdf import PdfFileWriter, PdfFileReader input1 = PdfFileReader(file('myfile','rb')) input1.input1.getDocumentInfo() 此代码返回 {'/Producer':

    7热度

    1回答

    我想用requests将文件直接下载到内存中,以便将它直接传递给PyPDF2阅读器,避免将其写入磁盘,但我不知道如何通过它作为file object。以下是我已经试过: import requests as req from PyPDF2 import PdfFileReader r_file = req.get('http://www.location.come/somefile.pdf'

    0热度

    2回答

    目标=打开文件,加密文件,写入加密文件。 尝试使用PyPDF2模块来完成此操作。我已经验证过“输入”是一个文件类型的对象。我研究了这个错误,它转化为“找不到文件”。我相信它以某种方式与文件/文件路径链接,但我不确定如何调试或排除故障。并得到以下错误: Traceback (most recent call last): File "CommissionSecurity.py", line

    0热度

    1回答

    我尝试使用requests库下载多个pdf,并使用pypdf将它们合并在一起。一般来说,这工作正常,但对于一些PDF,我只是得到一个错误。 MWE.py import requests from pyPdf import PdfFileWriter, PdfFileReader from StringIO import StringIO input = PdfFileReader(Str

    3热度

    2回答

    因此,我过去曾经使用过reportlab和pypdf2来使用python生成PDF文件,但我想知道什么是最有效的方式来生成PDF中的数据帧大熊猫。 有什么想法?

    0热度

    2回答

    有没有一种方法来使用Python创建一个多层的PDF。但不合并。 我认为多层PDF意味着页面中有多个图层,我可以选择在Acrobat中显示哪一层。 这里是我找到分层PDF文档: http://www.open.ac.uk/opencetl/files/opencetl/file/ecms/web-content/Multi-pdf-how-to-%20file.pdf 和分层PDF的例子: htt

    0热度

    1回答

    我想将一个长的PDF文档分成许多部分,例如:第1部分包括第3-14页,第2部分包括第15-19页,第3部分包括第20-27页,使用PyPDF2。 我编写了一个循环,将相关页面从原始PDF中取出并保存为每个部分的新文档。唯一的问题是,部分2仍包括从部分1中的所有页,并且第3部分仍然包括从部件的页面1 & 2. 我假设我无论如何都必须“复位”输出= PdfFileWriter(),但如果我把它放到wh