2012-08-08 484 views
0

我在我的应用程序中使用tesseract库进行图像扫描。我已经在某处看到该库为图像提供了超过100 DPI的良好性能。我正在使用iPhone 4和iPad捕获照片并将其作为tesseract库的输入。但仍然存在库给出不可读的输出。什么是iPhone的DPI或iPad相机?我如何提高tesseract库的性能?什么是在iPad或iPhone相机拍摄的照片的DPI?

+3

每英寸点数取决于相机距离拍摄对象的距离。这不是一个恒定的价值。 – 2012-08-08 07:24:44

+0

“image> 100 DPI”提示必须来自不了解DPI措施实际含义的人。我怀疑tesseract会识别以600 DPI显示的图像上的3像素字符。你需要知道的是人物应该在图像中有多大,这与DPI无关。 @robmayoff给了这个问题唯一合理的答案。 – Pascal 2012-08-09 03:25:12

回答

4

获取一个12英寸的尺子和一个卷尺。把统治者放在桌子上。将手机放在标尺上方,将相机对准标尺。使用卷尺测量从标尺到相机的距离。拍一张尺子的照片。

在图像查看器或编辑器中打开照片。 (例如,您可以在Mac上使用“预览”。)使用图像查看器/编辑器以像素为单位测量标尺的大小。

将尺子的尺寸(以像素为单位)除以12.这就是标尺图片的每英寸像素数(即每英寸点数或DPI),此数值取自用卷尺测量的距离。

关于需要100 DPI的一点是,OCR库需要足够的分辨率来识别字母。它可能希望字母是15-20像素高(我猜)。如果字母太小,则图像可能没有足够的信息供OCR库使用。字母也可能太大 - 图书馆可能没有编程查找100像素高的字母。如果这些字母大小适中,但模糊不清,OCR库可能无法识别它们。

这可能只是因为您正在尝试拍摄太小的文字图片,所以当您将相机握得足够近以使字母尺寸合适时,相机无法对焦且照片模糊不清。在这种情况下,您可能无法解决这个问题(除了让手机配备更好的相机)。

0

它具有72个dpi的,至少这是它存储在EXIF enter image description here

+0

这只是一个占位符。它不代表照片中每个物理英寸的像素。 – 2012-08-08 07:25:38

+0

@robmayoff:那我的照片是由iPhone拍摄的DPI是什么 – 2012-08-08 07:36:06

+1

@VXtreme我回答说,在我的评论你的问题。 – 2012-08-08 07:37:27

相关问题