我在每个包含2个pdf的主文件夹中有3000个子文件夹。 我写了下面的代码来转换文本文件中的PDF。PDF到文本文件的转换
* all.subfolders < - list.dirs( “#路径主文件夹”,full.names = TRUE)
sapply(all.subfolders[-1], function(x) {
file <-list.files(x, full.names=TRUE)
lapply(file, function(x) system(paste('"C:\\Program Files (x86)\\xpdfbin-win-3.03\\bin64\\pdftotext.exe"', paste0('"', x, '"')), wait = FALSE))})*
有
但在几个PDF文件可能无法在文本转换,如何让他们在一个列表左右。 请帮忙。
为什么不能转换这些pdf?你收到错误信息了吗?也许这些PDF文件不包含文本? –
它们包含文本,但我认为PDF是扫描的文件,因此无法转换。我dint得到任何错误消息。执行命令后,我发现他们转换的文件在各自的文件夹中。 –