0
我的问题是,我必须将多页PDF转换为文本,因此我使用imagemagick软件将PDF简单地转换为图像,我很容易从图像中提取文本。但问题是,如果PDF超过40页,那么它只会转换PDF中的最后一页,因此要么将每个页面转换为图像格式,要么将所有PDF页面制作成单一图像。我应该怎么做?如何将多页PDF转换为imagemagick中的多图像通过php
在这里,我已经做到了单页PDF这里的每一个PDF转换成图像,并存储在这里上传文件夹,你可以看到:
$image = new Imagick(__DIR__.'/'.$target_file);
$image->setImageFormat('png');
$imageName = __DIR__.'/uploads/'.time().'.png';
$image->writeImage($imageName);
请帮助我。我在等待回应。
为什么这个问题被标记为'JSON'? – arkascha
答案取决于你使用的OCR解决方案,我会说。更具体的什么输入格式提供最佳的识别结果。 – arkascha
我只是想知道如何将PDF的所有页面转换为图像格式。意味着要么将PDF的所有页面转换为分离的图像文件,要么应该创建整个PDF文件的单个图像。在这种情况下我该怎么做。 –