2014-10-27 85 views
1

我正在研究需要我从pdf中提取文本的问题。我正在使用pdfbox才能这样做。所以,我在终端(linux的Ubuntu的)运行这个命令:为文件夹中的所有文件递归运行终端命令

java -jar pdfbox-app-1.8.7.jar ExtractText [path leading to file here] 

和一切正常。但是,我想递归地为特定目录中的数千个文件执行此操作,因此我不必每次都手动插入pdf路径。我将不胜感激任何来自终端或脚本的解决方案。

+0

两个字:'人find')) – georg 2014-10-27 15:49:05

+0

'因为我在的* .pdf;做java .... ExtractText $ i;完成',基本上 – 2014-10-27 15:49:58

回答

3

使用find命令:

find /path/to/directory -type f -exec java -jar pdfbox-app-1.8.7.jar ExtractText {} \; 
+0

对于其他一些用途,我需要最终给/ path/to /目录,这有多可能? – supremum 2016-09-20 16:40:01

+1

在'\;'之前放置'/ path/to/directory'。 – Barmar 2016-09-20 16:46:08

+0

@supremum我建议你问一个新问题,而不是在评论中试图解决这个问题。 – Barmar 2016-09-20 19:11:27

相关问题