2008-08-05 59 views
25

我目前正在进行一个项目,我的目标是在图像中查找文本。 OCR的文本是不是我的意图到目前为止。我想基本上获得图像内文本的边界。我正在使用AForge.Net成像组件进行操作。在某种意义上或其他方面的协助?在图像中查找文本

更新09年2月5日: 我已经沿着我的项目中的另一条路线。不过,我尝试使用MODI(Microsoft Office Document Imaging)获取文本。它使您可以轻松地OCR图像并从中拉出文本。

回答

12

这是一个活跃的研究领域。关于这个问题,学术论文的字面上有很多。特别是没有更多的资格,给你提供帮助将会很困难。你在寻找特定类型的文字吗?字体?仅限英语?你熟悉学术文献吗?

“文本检测”是任何OCR(光学字符识别)系统中的标准问题,因此在处理它的网页上存在大量代码。

我可以开始列出从谷歌链接堆,但我建议你只是做一个“文本检测”的搜索,并开始阅读:)。还有充足的示例代码可用。

3

识别图像中的文字确实是该领域研究人员的热门话题,但是只有当captcha's成为防范垃圾邮件机器人的“标准”时才开始失控。为什么使用captcha作为保护?因为它很难在图像中查找(并阅读)文本!

我之所以提到captcha的原因是因为最大的进步*是在这个微小的区域内完成的,我认为你的解决方案可以在那里找到最好的。 特别是因为captcha的确是关于在混乱的图像中查找文本(或类似文本的东西),然后尝试正确地读取这些字母。

所以,如果你可以找到自己a good open source captcha breaking tool你可能有所有你需要继续你的追求...
你也许甚至扔掉,处理字符识别本身是最难治的代码,因为那些OCR的用于读取扭曲的文字,你不需要做的事情。

*:在进步可见,易用,实用信息条款“非研究人员”

+0

提到验证码的另一个原因是这可能是他的“项目”。 :-) – 2009-02-05 17:37:16