2013-04-07 50 views
3

我试图通过tesseract做到这一点,但生成的apk文件是8 MB。 我在Play中看过Goggles应用程序,效率很高。 我想知道如何整合这种技术。我没有看到任何教程。 如果有人知道如何做到这一点,请回复。Android的谷歌ocr api(图片到文字转换)

另外我该如何提高我正在使用的Tesseract的质量。 转换很流畅,但我想知道如果我将图像分成若干部分,然后分别进行解析,那会有用吗?

要求是它应该读取账单或收据,所以我想提高文本转换的质量。 请建议。

+0

请您详细说明一下吗? – Sid 2013-04-07 10:07:35

+0

请参阅编辑的问题。 – 2013-04-07 10:52:17

+0

你好!你能告诉我如何建立苔丝二。 Eclipse给我错误无法编译。 – Newts 2013-04-25 08:17:10

回答

2

我相信你在编译这个项目:tess-two。我对么?

如果是这样,您可以通过为特定的CPU架构编译不同的APK来大大减小APK的大小。此外,您可以删除Leptonica的大部分功能,因为您不需要它们。

为了获得更好的精度:

  • 如果您正在使用手机的摄像头输入,你应该改变二值化算法。 Leptonica有一些二进制化算法,请尝试Sauvola。
  • 调整tesseract的参数以获得更好的性能与速度。
  • 确保您在所有手机上都有一致的分辨率。某处大约300dpi。

如果您想要一个在大多数手机上运行速度很快的小应用程序,请考虑在服务器上运行OCR,而不是在手机上运行。

据我所知,Tesseract是迄今为止可以为Android编译的最好的OCR引擎。它必须正确调整并提供良好的图像。

+2

是的,我正在编译苔丝二,看问题是,它不给出准确的结果与不同的方向,有闪光灯拍摄的图像的问题,也结果与不同设备有所不同。我将我的应用与Google Goggles进行比较,每当我失败时,Ijust都希望能够实现像Goggles这样的准确性和速度。谷歌使用的是什么技术,它是否通过Google Drive驱动。我还实施了Abby ,但这也花费了大量时间,比Goggle花费的时间多20倍。您是否有任何想法实施Google Goggles。 – 2013-04-16 13:39:39

+0

您到目前为止是否找到了解决方案? – Sheychan 2015-08-12 05:37:16