在图像中查找文本

我目前正在进行一个项目，我的目标是在图像中查找文本。 OCR的文本是不是我的意图到目前为止。我想基本上获得图像内文本的边界。我正在使用AForge.Net成像组件进行操作。在某种意义上或其他方面的协助？在图像中查找文本

更新09年2月5日：我已经沿着我的项目中的另一条路线。不过，我尝试使用MODI（Microsoft Office Document Imaging）获取文本。它使您可以轻松地OCR图像并从中拉出文本。

2008-08-05 Pat

这是一个活跃的研究领域。关于这个问题，学术论文的字面上有很多。特别是没有更多的资格，给你提供帮助将会很困难。你在寻找特定类型的文字吗？字体？仅限英语？你熟悉学术文献吗？

“文本检测”是任何OCR（光学字符识别）系统中的标准问题，因此在处理它的网页上存在大量代码。

我可以开始列出从谷歌链接堆，但我建议你只是做一个“文本检测”的搜索，并开始阅读:)。还有充足的示例代码可用。

2008-08-05 03:24:27

识别图像中的文字确实是该领域研究人员的热门话题，但是只有当captcha's成为防范垃圾邮件机器人的“标准”时才开始失控。为什么使用captcha作为保护？因为它很难在图像中查找（并阅读）文本！

我之所以提到captcha的原因是因为最大的进步*是在这个微小的区域内完成的，我认为你的解决方案可以在那里找到最好的。特别是因为captcha的确是关于在混乱的图像中查找文本（或类似文本的东西），然后尝试正确地读取这些字母。

所以，如果你可以找到自己a good open source captcha breaking tool你可能有所有你需要继续你的追求...
你也许甚至扔掉，处理字符识别本身是最难治的代码，因为那些OCR的用于读取扭曲的文字，你不需要做的事情。

*：在进步可见，易用，实用信息条款“非研究人员”

2008-08-05 06:00:46 sven

提到验证码的另一个原因是这可能是他的“项目”。 :-) – 2009-02-05 17:37:16

如果你确定使用这个网上API，在http://www.wisetrend.com/wisetrend_ocr_cloud.shtml的API可以做文字除了OCR之外的检测。

2010-06-23 05:49:10

Stroke width transform可以为您做到这一点。这至少是MS为他们的手机操作系统开发的。关于实现的讨论是here at https://stackoverflow.com/

2013-04-19 14:54:49 Mathias

回答