2010-11-30 73 views
7

我正在寻找一个解释/ API文档/示例如何使用(和培训?)Tesseract在C++中,在谷歌Tesseract页面上没有任何用处,但还没有找到网络上的东西。Tesseract或任何其他OCR lib

任何有用的来源,经验都会比欢迎,因为我不知道如何开始。

P.S:

  1. 我打开其他 库的建议。
  2. 只有免费

回答

4

我有一个正方体... 培训正方体“的一个简单的谷歌的一些经验显示此页: http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract ,你必须选择你想要哪个正方体的版本火车.. 尽管3是最新版本,但它是全新的,因此人们仍然在解决任何问题 - 即时通讯仍然使用2.4版本。无论如何,你会发现为特定的“语言”(或者应该被称为'字体'或'字符集')训练tesseract大约有9个步骤。您也可以使用现有的'eng'语言 - 但这取决于您的应用程序。例如,在我的应用程序中,我将不得不进行文档分析并采取特定区域,并希望OCR输入一串13个字符的数字 - 我需要很高的准确性 - 而且我不希望它将'5'读作' S'和'0'为'O'等,所以根据我的特定字体创建一个特定的“语言”是唯一的,它只包含字符0..9,而你可能并不在乎是否有额外的噪音

+0

谢谢,任何想法,我找到一个教程/ API文档的C + +? – snoofkin 2010-11-30 18:34:33

0

Tesseract Ocr是一个用于检测光学字符的开源库。如果您使用的是Visual Studio,则只需包含库文件即可。如果您正在使用qt创建器,那么您必须构建库以在QT上工作。您需要使用CMakelist或Cmake Gui构建库。 您可以访问的链接 Opencv Ocr build for Qt 5.4 mingw