2017-08-26 104 views
0

Following up on this post改善图像的DPI

你好社区。我试图解决上述帖子中提到的同样的问题。我想在将图像发送到OCR之前对图像进行预处理,以便我可以获得体面的输出。出于这个原因,我想增加图像的DPI,建议的解决方案是使用Imagemagik。有人可以帮助我如何使用Imagemagick重新采样图像。它有很多重采样滤波器,我不确定如何进一步处理。 以下是ImageMagick重新采样页面Resampling的链接。

我是新来的信号处理和计算机视觉。我希望有一位大师能够告诉我做什么和如何做。

+0

DPI是一个非常随意的测量,它只是一个可以随意更改的元数据。你想要做的是真正放大图像(相同物理尺寸的更多像素:更多DPI)。但恕我直言,这种方式添加像素将无法正常工作。 OCR软件需要更多的DPI,因为它通常意味着需要处理更多信息(在300DPI时,小写字符大约为20x20像素)。但是,当您放大图片时,您不会在图片中添加信息(实际效果是放大的图片要么是像素化的,要么是模糊的,取决于所使用的算法),而OCR不会获取更多的数据来缩小图片。 – xenoid

+0

@xeniod您的回复在这里应该是一个答案! – dlemstra

+0

@xenoid所以你建议远离重采样?此外,我打算使用维纳滤镜来锐化图像。我以为我会先进行重采样,然后使用scikit Image中的维纳滤镜去除增加的模糊。就像我提到的,我是这个领域的新手,并且高度重视您的意见。 – Random

回答

4

DPI是一个非常随意的测量,它仅仅是一个可以随意更改的元数据。你想要做的是真正放大图像(相同物理尺寸的更多像素:更多DPI)。

但恕我直言,添加像素的方式将无法正常工作。 OCR软件需要更多的DPI,因为它通常意味着需要处理更多的信息。在300DPI下,10点小写字符大约是20x20像素(400像素),在100DPI时,它只有7x7。

当您放大图片时,您不会在图片中添加信息。新像素只是从现有的像素计算而来。实际效果是,放大的图像要么是像素化的,要么是模糊的,这取决于所使用的算法,而OCR并没有真正获得更多的数据。

TL; DR:您可以尝试重新采样,但它不太可能工作。

在水獭手上DPI在这里没有意义。它仅在扫描通常尺寸(大约10个点)的打印文本时用作指示,真正计数的是字符的大小(以像素为单位)。如果它们已经在20x20左右(高DPI的小字体或低DPI的大字体),那么你应该没问题。