pypdf

    1热度

    1回答

    我试图使用pyPdf从大pdf中提取几页到单独的文件。每当我这样做,结果文件大小几乎与源文件相同。我认为它与文件内的书签有关,因为如果页面不包含任何链接,则输出文件的大小非常小。我无法弄清楚如何从输出文件中排除书签。 from pyPdf import PdfFileWriter as writer, PdfFileReader as reader w = writer() r = reade

    2热度

    1回答

    我有一个pdf文件。我想通过该文件中的某个特定单词将该文件分割成多个pdf文件 。我怎么能在Python中做到这一点?

    3热度

    1回答

    我正在尝试使用PyPDF模块创建一个Python脚本。脚本是如何处理“根”文件夹的,将所有PDF合并并将合并的PDF输出到“输出”文件夹中,并将其重命名为“Root.pdf”(包含分割PDF的文件夹)。它的作用就是对子目录做同样的事情,给最终的输出一个和子目录相同的名字。 当我来处理子目录,给我一个与某些十六进制值相关的错误代码时,我被卡住了。 (它似乎是得到一个空值,这是不以十六进制) 这里产生

    1热度

    1回答

    因此,这里是我的导入: from pyPdf import PdfFileWriter, PdfFileReader 这里是我写我的PDF: filenamer = filename + '.pdf' pdf = PdfPages(filenamer) (伟大的命名规则,我知道!) 我写一些东西出来。 我在这里关闭它: pdf.close() 这里就是我尝试阅读: input1 =

    8热度

    3回答

    更新:感谢stardt的脚本工作! pdf是另一个页面。我在另一个脚本上尝试了脚本,它也正确地吐出每个pdf页面,但页码的顺序有时是正确的,有时是错误的。例如,在pdf文件的第25-28页中,打印的页码是14,15,17,16。我想知道为什么?整个pdf可以从http://download304.mediafire.com/u6ewhjt77lzg/bgf8uzvxatckycn/3.pdf 原始

    0热度

    2回答

    我遇到一些问题,我用一个小程序编辑了使用pyPdf编辑PDF。我试图到PDF(self.lastpage)作为默认参数的最后一页传递到一个类的方法(pageoutput)当我这样做,我收到以下错误: Traceback (most recent call last): File "C:\Census\sf1.py", line 5, in <module> class PdfG

    3热度

    2回答

    我无法合并pyPDF逻辑将两个pdf文件合并到我的django网站。我写了工作在本地服务器上的Python文件运行时(合并文件的代码,但我需要明确地确定哪些文件合并: from pyPdf import PdfFileReader, PdfFileWriter output = PdfFileWriter() input1 = PdfFileReader(file("abc_form0.pd

    1热度

    1回答

    我正在努力如何使用另一个PDF作为Python中的模板创建PDF报告。 我有一个PDF文件(Template.pdf),可以用作模板来创建报告每一天。 Template.pdf看起来像以下: ABC Corp Daily Sales Report Report Date: SalesName OrderQty ConfirmedQty ShippedQty 我需要以编程

    5热度

    2回答

    from pyPdf import PdfFileReader f = open('document.pdf', 'rb') p = PdfFileReader(f) o = p.getOutlines() List对象o包括字典的对象pyPdf.pdf.Destination(书签),其中有许多属性,但我找不到任何引用的页面数量书签 我怎样才能返回页数,比方说o[1]书签? 例如o[1

    3热度

    1回答

    我在Windows平台上使用Python 2.4和PyPdf 1.13。 我想从列表合并PDF文件合并成一个使用下面的代码: import os from pyPdf import PdfFileWriter, PdfFileReader attached=["C:\\test\\T_tech.pdf","C:\\test\\00647165-Backup.pdf"] output=Pdf