2015-11-19 94 views

回答

0

如果您使用的是不具有专用的自动旋转功能,OCR技术(大部分做的,所以仔细检查),然后我用的方法是检查是否有任何字符置信度或检查用于词典中的单词。例如,ABBYY OCR具有专用的自动旋转设置。 OCR-IT API也具有自动旋转功能,并且还可以返回XML结果中的标志,例如IsWordFromDictionary。每种OCR技术的工作可能不同。

如果您预计只有4个可能的旋转,则算法为:

  1. 执行OCR。检查信心,或字典的单词,甚至只是大写(不正确的旋转会产生像这样的混乱:DioOpUllltG)。设置接受结果的阈值,例如50%。您希望您的第一个OCR通行证来自正确方向的图像(统计方法)。
  2. 如果质量低于您的阈值,那么您的图像质量不佳或方向错误。旋转并检查剩余的三个方向。选择最好的一个。

在某些项目中,图像可能处于不可预知的极端角度(如30度),因此执行4次翻转时,OCR在每种情况下都会失败。然后,我通常每10度旋转一次使用OCR传球(36次OCR传球),并选择最佳情况。

+0

建议无误。一个可行的解决方案。我认为我尝试了4种不同的状态,然后我尝试。但OCR过程的高成本并不快(Tesseract OCR不够快)。时间也在增长。 –