我已经得到pypdf工作就好了一个单一的PDF文件,但我似乎无法让它工作的文件,或for循环多个pdf文件,没有失败,因为的字符串不可调用。任何想法我都可以用作解决方法? def getPDFContent(path):
content = ""
# Load PDF into pyPDF
pdf = pyPdf.PdfFileReader(file(path, "r
我想写一个程序在Python中,需要一个PDF文件,并附加到它第一个任何pdf,其中包括一个水果的名称(芒果,橙或苹果) ,然后将pdf的动物名称附加到原始文件(斑马,猴子,狗),最后附加任何剩余的PDF。这是我的代码: import os
from PyPDF2 import PdfFileReader, PdfFileMerger
originalFile="C:/originalFil
我想解析PDF文件使用pdfMiner,但提取的文本得到合并。我正在使用以下链接中的pdf文件。 PDF File 我好与任何类型的输出(文件/串)。下面是代码,它将提取的文本作为字符串返回给我,但由于某些原因,列被合并。 from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from
我试图从PDF中提取文本,以便我可以分析它,但是当我尝试从页面中提取文本时,我收到以下错误。 Traceback (most recent call last):
File "C:\Program Files (x86)\eclipse\plugins\org.python.pydev_2.7.4.2013051601\pysrc\pydevd_comm.py", line 765, in do