2012-07-27 75 views
-1

我开发了一个需要OCR引擎的ANPR应用程序。我正在尝试使用tesseract作为OCR引擎。但我真的找不到一个适当的一步一步教程或指导如何将tessnet2它包括在我的C#.Net项目中。我已经培训过tesseract v3.01。有人可以帮助解决这个问题吗?如何整合Tesseract?

感谢

+0

查看Subtitle Edit的源代码。这是一个C#应用程序,它利用Tesseract来处理OCR的位图字幕。 http://www.nikse.dk/SubtitleEdit/ – 2012-07-27 08:25:45

+0

它看起来有点复杂,我没有看到这个项目使用了什么DLL? – 2012-07-27 08:40:12

回答

1

你不能用正方体2.04引擎使用3.01的数据 - 它们没有Tesseract Wiki状态兼容。你需要Tesseract 3.0x引擎。有一个3.01的.NET包装:tesseract-ocr-dotnet

+0

嗨,感谢您的回复我只是想通了,我发送了一个dll文件,我可以包括在我的项目中,但我仍然没有得到什么文件后,为我自己的字体类型培训tessreact包括。我应该使用tesseract 3.01v培训后使用tessdata文件夹中生成的所有文件吗?另一部分我没有得到是为什么你投下我的问题大声笑 – 2012-07-28 16:45:29

+0

顺便说一句我试了几件事情与文件似乎我得到正确的文件int他tessdata文件夹。但它会抛出此运行时exeption“试图读取或写入受保护的内存,这通常表示其他内存已损坏。”我的系统是64位可以这是一个问题?并且它被扔在Init().. – 2012-07-28 17:15:28

+0

它可能是你的图像或项目设置。看看VietOCR.NET(http://vietocr.sf.net)应用程序的一个使用上述DLL的工作示例。 – nguyenq 2012-07-28 17:51:35