2010-04-07 79 views
3

我得到了廉价的相机拍摄的灰度图像,我需要制作一个程序OCR。 主要问题是噪音或对象不是文字,但它们以二值图像呈现。 现在我想起从图像中提取文本。图像的文本检测

我需要一些很好的算法。 你能提出一个非常好的建议吗? 例如,如果图像包含黑色文本和类似黑线 的东西,那么该算法将只选择没有行的文本。

+1

OCR已经有一段时间了。你需要*建立自己的任何理由,而不是寻找现有的工具?至于算法,我相信有很多。通常情况下,您需要具有您正在搜索的字符的现有模板,然后让程序查看图像中是否存在任何这些模板。 – FrustratedWithFormsDesigner 2010-04-07 15:30:18

+0

其他工具如果图像包含明文 ,即使手写文本的ocr对于该图像也不太好。 我试过tesseract google,gocr。 你是什么意思的字符模板? – maximus 2010-04-07 15:39:26

+0

@ maxiumus:OCR系统需要一些参考点,它需要知道什么是合适的“A”,然后才能识别出*可能是“A”的图像。可能有不止一种方法来实现这一点,建议只会是其中一种方式。 – FrustratedWithFormsDesigner 2010-04-07 15:42:53

回答

2

您将描述要删除的两种类型的噪音。 (顺便说下,wikipedia page对于降噪并不差,请看“图片”部分)。

一种是奇点噪声。这通常被称为“斑点”或“盐和胡椒”噪声,通常通过某种平均滤波器来去除。有一个很好的网页在mathworks上描述了一些算法。

第二种是线条。这很难,我不会真的把它描述为噪声,它会依赖于你的输入图像类型。 This paper似乎是合适的,但它不可用于免费在线,所以你可能需要购买它或去当地的大学图书馆。

你可能也想看看this,这是可以从很多地方下载,但真正用于电影(视频),所以可能不是你想要的。