我试图运行pdftotext
使用python subprocess
模块。Python子进程调用xpdf的pdftotext不能与编码一起工作
import subprocess
pdf = r"path\to\file.pdf"
txt = r"path\to\out.txt"
pdftotext = r"path\to\pdftotext.exe"
cmd = [pdftotext, pdf, txt, '-enc UTF-8']
response = subprocess.check_output(cmd,
shell=True,
stderr=subprocess.STDOUT)
TB
CalledProcessError: Command '['path\\to\\pdftotext.exe',
'path\\to\\file.pdf', 'path\\to\\out.txt', '-enc UTF-8']'
returned non-zero exit status 99
当我删除最后一个参数 '-enc UTF-8' 从CMD,它在Python的工作原理确定。
当我运行pdftotext pdf txt -enc UTF-8
在cmd
,它工作正常。
我缺少什么?
谢谢。
我相信你需要'[pdftotext,PDF,TXT ,'-enc','UTF-8']' –
我试过了,但它工作但编码不起作用。它给ANSI编码的文件。 – Rahul
我看到了....将命令作为字符串传递? –