2008-10-21 130 views
16

如何才能以编程方式搜索并替换大量PDF文件中的某些文本?我想删除已添加到一组文件的URL。我已经能够在Adobe Pro的批处理中使用JavaScript删除链接,但链接文本仍然存在。我已经看到建议使用文本修改,它可以手动工作,但我不想手动修改1300个文件。如何编程文本搜索并替换为PDF文件

+0

我知道它确实很旧,但我遇到了这个问题,而且您是第一个结果在谷歌。最后你用了什么? – Elric 2015-01-28 19:10:48

+0

我使用Perl,CAM :: PDF模块以及Chris Dolan的答案中提供的示例changepagestring.pl程序。这是一次性的事情,所以不要问我现在该怎么做;-) – rpilkey 2015-01-29 14:05:19

回答

14

由于文档格式的图形性质,在PDF中查找文本本质上很难 - 您正在搜索的字母在文件中可能不是连续的。也就是说,CAM::PDF有一些搜索替换功能和启发式。试试changepagestring.pl,看看它是否适用于您的PDF。

+1

非常感谢克里斯,为答案和CPAN上的模块。这对我来说很好。希望谷歌拿起这个页面,我没有在我的搜索中看到CAM :: PDF模块。 Roger – rpilkey 2008-10-21 18:26:03

4

我也变得绝望了。经过10 PDF编辑器的安装,所有的成本钱,没有成功:

PDFTK +编辑器就够了:

在PDF替换文本文件

  • 使用PDFTK解压缩PDF页面 流

    pdftk original.pdf output original.clear.pdf uncompress

  • 替换文字(有时候这是 的作品,有时候不会)。

  • 修复修饰(和现在碎) PDF

    PDFTK original.clear.pdf输出original.clear.fixed.pdf

(乔尔敢)

2

不知道我想要做的所有工作,编写代码来修改你的1300个文件时,有一个程序,它可以为你做。有一天,我使用专业版的Infix通过“在文件中查找和替换”功能批量修改近100个文件。它效果很好。我已经评估过其他程序,希望找到类似于Microsoft Word的查找和替换功能。 Infix是我发现可以做到的唯一一个。退房时间:http://www.iceni.com/infix-pro.htm

1

我刚刚完成了一个由带有变音符号的文本组成的文本的中缀,希望能够生成另一个文本,其中带有双音节和组合变音符的字符被替换为单个变音符号。 Infix对于那些不理解程序解决方案工作的麻烦的人来说绝对是一个很好的解决方案。所有请求更改都已生效。仍然需要了解如何影响改变文本布局的单词的重排。

1

这只是解决方案的一半,但我使用了Touch,结合AppleScript支持发送击键来替换数千个表格单元格中的字符串。取决于你的页面布局如何,它可以为你工作。在我的情况下,我不得不手动插入光标在每个表的开始处(数十个表格 - 对于手动过程非常易于管理),但是之后我自动替换了数千个单元格。

1

的问题是一个纲领性的解决方案,但我仍然会分享这个免费的在线工具,它帮助了一些PDF文件,我的质量替换文本:

http://www.pdfdu.com/pdf-replace-text.aspx

我没有看到任何广告或其他修改在替换文本后生成的PDF文件中。

我无法使用我试过的软件在本地进行更改。我认为主要的问题是我错过了PDF中使用的字体,即使使用Acrobat Pro,它也无法正常工作。在线工具没有抱怨,并产生了很好的结果。

0

我建议你可以使用VeryPDF PDF文本代用品命令行软件批量的PDF页面替换文本,您可以运行pdftr.exe轻松替换PDF页面的文本,例如,

pdftr.exe -contentreplace “My Name => Your Name”D:\ in.pdf D:\ out.pdf

pdftr.exe -searchandoverlaytext“My Name => Your Name”D:\ in.pdf D:\ out.pdf

pdftr.exe -searchandoverlaytext “我的名字=> d:\ TEMP \ myname.png * 20 * 20” d:\ in.pdf d:\ out.pdf

pdftr.exe -pagerange 1-3 -contentreplace“Old Text => New Text || VeryPDF => VeryDOC ||我的名字=>您的姓名”D:\ in.pdf D:\ out.pdf

pdftr .EXE -searchtext “字符串” C:\ in.pdf

pdftr.exe -pagerange 1个-searchtext “字符串” C:\ in.pdf

pdftr.exe -pagerange 1个-searchandoverlaytext“老文本= >新文本|| VeryPDF => VeryDOC ||我的名字=>您的姓名“D:\ in.pdf D:\ out.pdf

pdftr.exe -overlaytextfontname”Arial“-overlaytextcolor FF0000 -overlaybgcolor 00FF00 -searchandoverlaytext “旧文本=>新文本|| VeryPDF => VeryDOC ||我的名字=> Y我们的名字“D:\ in.pdf D:\ out.pdf

pdftr.exe -opw 123 -upw 456 -contentreplace”Old Text => New Text || VeryPDF => VeryDOC || My Name => Your名称” d:\ in.pdf d:\ out.pdf

pdftr.exe -searchandoverlaytext “PDFcamp打印机=> VeryPDF打印机” -overlaytextfontsize 8 d:\ in.pdf d:\ out.pdf

pdftr.exe -searchandoverlaytext“PDFcamp Printer => VeryPDF Printer”-overlaytextfontsize 80%D:\ in.pdf D:\ out.pdf