2011-02-18 57 views
3

基本上我正在使用tessract OCR阅读车辆牌照,但是尽管能够通过改变对比度足够轻松地强调文本,减少噪音等,车辆的某些“零件”仍保留在该图像确实会导致OCR投掷不良结果。图片OCR - 过滤不需要的数据

例如采取:

enter image description here

我可以改变这一点很容易不够,如:

enter image description here

我期待消除掉每块板的边缘,这里的另一个例如:

enter image description here

我可以使用像素操作算法去除边缘,但是我不觉得这是正确的方法,并且会导致很多问题。

我一直在使用以下应用程序来测试各种方法,如形态学和消除不需要的数据,到目前为止我还没有成功。

http://www.codeproject.com/KB/GDI-plus/Image_Processing_Lab.aspx

但是有人用这方面的知识可以在文章使用上面的应用,实现要我想,可以随意给它一个尝试。

谢谢

+0

[`这algorithm`](http://stackoverflow.com/questions/4777677/license-plate-recognition-determining-color-范围为像素比较/ 4778495#4778495)似乎能够隔离您的盘子文字...:D – 2011-02-18 20:10:19

回答

0

我已经做了这样的算法。我可以说它效果很好。秘诀在于,你需要知道光源也许只是来自一侧。仅使用一个阈值就无法将图像设置为“黑/白”。

检测图像各部分的平均亮度,并使用此亮度计算来设置每个区域的阈值。

例如,如果左上角较轻,则需要较低的阈值才能使这些部分不亮。如果右下方光线较暗,则需要将阈值设置得更高才能接收所有现有的光照信息。

然后,你只需要使用方法驶入从两侧的图像:

IsPixelAboveThreshold ? 

如果低于,你在边境上,如果是上面,你可以说你是在更多亮度的图像中间。

Regards

1

请尝试使用笔画宽度转换概念。

此概念使用从自然图像段文本.....