2016-02-27 88 views
3

到目前为止,我已经使用tess-two构建了一个ocr应用程序。为了构建应用程序,我下载并构建了tess-two库(感谢rmtheis!)。如何在Windows 7上使用tess-2下载并构建Tesseract?

我需要改进OCR输出,因为结果的准确性水平低于20%。我只使用数字(0到9),我希望达到100%的准确性。

我已经下载了一些博客推荐的ghostscript,vietocr和serak,我经历过。他们比其他大多数关于这个主题的参赛作品更详细地介绍了培训过程。 (链接:Pradeep's Blogreachsri site

我的问题是;我必须再次下载tesseact应用程序吗?

培训中的一些步骤似乎意味着我将执行开始用“tesseract.exe”开始的命令,并且我的计算机上没有任何此类文件。

我还需要下载tesseract应用程序吗?或者我可以用tess-two工作吗?

任何和所有的帮助将不胜感激。

回答

1

您可以在Windows或Linux上培训Tesseract,并使用tess-2生成的.traineddata文件。确保您的工具包含Tesseract培训可执行文件。

+1

亲爱的Nguyenq,谢谢你的回复。我想确定我理解正确。我应该下载tesseract应用程序并安装在我的Windows 7机器上?是“tesseract培训可执行文件”一个单独的包? – GeorgeF

+1

是的,你必须从源代码构建可执行文件。或者,他们捆绑在一些培训工具中,如[jTessBoxEditor](http://vietocr.sourceforge.net/training.html)或[其他](https://github.com/tesseract-ocr/tesseract/wiki /附加元件)。 – nguyenq

+0

谢谢阿甘,对于迟到的回复感到抱歉。我相对比较新,所以请帮助我理解;从源头构建tesseract是否有任何理由或优势?为什么没有站在“tesseract.exe”窗口?我做了一些搜索,惊奇地发现没有找到(“tesseract.exe”)!这是为什么?如果你有一个EXE文件,或者如果你认为从源代码编译将会更好,那么请帮助你建立一个常规EXE文件的链接,请给我一步一步的帮助。老实说,虽然,我宁愿站在EXE。再次感谢您的快速和有益的回应! – GeorgeF