2017-02-24 126 views
0

我的问题是,我必须将多页PDF转换为文本,因此我使用imagemagick软件将PDF简单地转换为图像,我很容易从图像中提取文本。但问题是,如果PDF超过40页,那么它只会转换PDF中的最后一页,因此要么将每个页面转换为图像格式,要么将所有PDF页面制作成单一图像。我应该怎么做?如何将多页PDF转换为imagemagick中的多图像通过php

在这里,我已经做到了单页PDF这里的每一个PDF转换成图像,并存储在这里上传文件夹,你可以看到:

$image = new Imagick(__DIR__.'/'.$target_file); 
$image->setImageFormat('png'); 
$imageName = __DIR__.'/uploads/'.time().'.png'; 
$image->writeImage($imageName); 

请帮助我。我在等待回应。

+0

为什么这个问题被标记为'JSON'? – arkascha

+0

答案取决于你使用的OCR解决方案,我会说。更具体的什么输入格式提供最佳的识别结果。 – arkascha

+0

我只是想知道如何将PDF的所有页面转换为图像格式。意味着要么将PDF的所有页面转换为分离的图像文件,要么应该创建整个PDF文件的单个图像。在这种情况下我该怎么做。 –

回答

2

我解决了我的问题,如果有人遇到类似的问题可以在这里看到。

$image = new Imagick(__DIR__.'/'.$target_file); 
    $num_pages = $image->getNumberImages(); 
    for($i = 0; $i < $num_pages; $i++) 
    {   
     $image->setIteratorIndex($i); 
     $image->setImageFormat('png'); 
     $imageName = __DIR__.'/uploads/'.$i.time().'.png'; 
     $var = $image->writeImage($imageName); 
    } 
相关问题