2012-03-22 116 views
2

我需要一种方法来增强降级的历史文档图像中的文本。阈值文档图像

enter image description here

我试着用大津算法和一些阈值技术,但有wasnt在质量上有较大提升。有人可以告诉最好的方式去解决这个问题。谢谢

+1

你可以显示一些示例图像? – vini 2012-03-22 16:39:51

+0

如果图像中的光照不均匀,您可以尝试基于本地邻域的阈值方法,而不是整个图像。 – Maurits 2012-03-22 21:59:05

+0

这就是它的样子:http://i44.tinypic.com/nqd6au.jpg – NeedHelp 2012-03-23 10:53:53

回答

3

我会使用颜色处理和本地阈值的组合。 作为第一步,看看价值(HSV)的平面,提取它,因为col上的黑色很容易被提取出来。我做了一些查找(一种对数灰度乘法),以使背景和文本之间的对比度更高。我使用了一种称为Niblack的局部阈值方法来提取文本,最后使用一些形态来去除微小的文物。 enter image description here

掩盖了整个事情,并平滑了一下(低通)。


编辑:我被要求添加引用Niblack。它通常是在1986年的教科书他写的引用,但为了更好的可访问性,我将指向你一份文件,还介绍了算法,并给出了如何用这个进行一些耐人寻味:

这些改进的算法是针对特定问题的,原来Niblack仍然是我转到开始时,我想本地化的阈值。

+0

非常感谢!这真的很有帮助。请您发布代码,以便我可以参考它? – NeedHelp 2012-03-25 02:50:00

+0

对不起,我没有真正的代码,我只是用IMAQ/Vision Assistant做了一个快速算法草图。我可以给你vscr-File,但它可能不会帮助你使用任何其他语言。但是没有必要,我提到的东西应该在大多数图书馆中实施。 – 2012-03-26 01:53:08

+0

但我只是做屏幕截图的步骤: http://imgur.com/a/8PGX2 1:价值平面 2:查找(sorta对数=调整亮度,对比度,伽马改善) 3:Niblack 4:去除小颗粒(形态学) 5:逆(好,只是为了让它看起来更好) 6:平滑(低通)。 你应该可以自己做掩模。看看这些高分辨率的照片,看看我做了什么。 – 2012-03-26 02:07:16

0

从我所看到的文字是黑色和背景是棕色的。尝试不仅使用亮度,而且使用颜色进行分割。