2011-09-25 69 views
0

我试图回忆一些关于字母的信息以启动某种带有神经网络的OCR。我还没有真正将所有的东西结合在一起,但是,我现在面临的问题是如何区分字符并将它们分开。喜欢的东西http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ (没有什么特别的,只是普通字体)识别图像上字符的开始和结束XY向量

我认为更好的办法是使for循环得到顶,最低x和y考虑每个字符和数字有加入的各个黑像素数量较大其他(虽然我是个例外)。

有没有什么样的库或算法可以帮助我呢?我使用Cimg进行图像处理。

难道这是真的硬?

回答

1

这听起来像你正在寻找一个连接组件标签。我们的想法是扫描图像以获得彼此连接的像素组,并返回一组对象(通常称为“斑点”),其中每个对象都包含该对象中的像素列表。

我不建议您自己写。 OpenCV有一个很好的工作,它基于

F.Chang,C.-J.Chen和C.-J.Lu,“线性时间分量标记算法使用轮廓跟踪技术”,计算机视觉和图像理解,第一卷。 93,没有。 2,pp。206-220,2004.

这里有一个更好的解决方案,专门用于查找字母。

+0

感谢您的回答。我会研究OpenCV,我同意如果已经有一些我可以使用的算法,我应该尽量避免自己做。是http://opencv.willowgarage.com/wiki/cvBlobsLib#Features你在说什么,对吧? – Filgera

+0

是的,就是这样。 OpenCV非常好。 – dantswain

0

你检查了OpenCV项目吗? Here是一个使用它编号OCR的教程。