Q
开源OCR
15
A
回答
1
Cuneiform是免费的,做一个体面的工作。你可以调用它作为一个子程序,但没有语言的结合,我知道的。它不会直接读取PDF文件,但你可以很容易地拆开是养活他们楔形文字扫描图像序列的PDF文件。还有一些脚本来重新组装图像和文本返回到一个可搜索的PDF。
12
正方体是一个非常好的OCR引擎:https://github.com/tesseract-ocr/tesseract
该项目已通过惠普实验室推出,现在由谷歌继续和赞助(对于谷歌图书!)。它在Apache许可证下发布,并在Linux上运行。它使用Tiff或PNG文件;对于PDF文件,您将需要转换为这些格式之一。我想没有绑定,所以你应该调用这个软件作为子程序...
0
尝试tesjeract,它使用JNI调用Tesseract OCR API。
对于PDF,你需要首先转换成图像,使用GhostScript的,例如。
相关问题
- 1. 开源的Windows Mobile OCR库
- 2. C#OCR算法或开源库
- 3. C#中的开源OCR好吗?#
- 4. 阿拉伯语开源OCR库
- 5. 阿拉伯语的开源OCR
- 6. 开源OCR系统,用于FPGA
- 7. 在eclipse上的JAVA OCR API开源
- 8. 在Windows XP上运行的开源OCR库
- 9. 开源办法实时图像处理OCR应用程序?
- 10. 可以将OCR文本插入源PDF的OCR库
- 11. 任何开源/免费的OCR(模式识别)软件? (用于移动平台?)
- 12. OCR Actionscript
- 13. 开源开发
- 14. PHP中的OCR,OCR-B字体?
- 15. OCR for android
- 16. OMR/OCR on android
- 17. Tesseract OCR相机
- 18. Opencv与Android- OCR
- 19. Android OCR库
- 20. Blackberry的OCR库
- 21. Google API Java OCR
- 22. Microsoft OCR Library
- 23. iPhone Abbyy OCR
- 24. Tesseract和Php ocr
- 25. OCR识别 - gocr
- 26. OCR与javacv
- 27. OCR库.NET
- 28. testcomplete中的OCR
- 29. GeoJSON开源库
- 30. 开源mini-heroku?
已检查该文本是不是在PDF已经上市,对不对? (我依稀记得,PNG,可能还需要存储文本的能力,但我可能是错那里)。 – 2011-05-15 23:37:12
http://www.roncemer.com/software-development/java-ocr – Trick 2012-08-28 08:49:30