2010-10-11 101 views
1

我想知道有没有办法通过编写代码将文本扫描图像转换为可读文本?那可能吗?扫描图像为可读文本

+1

Google OCR ..... – 2010-10-11 03:37:16

+0

Java? PHP?哪一个?都? ...我喜欢[OCRopus](http://code.google.com/p/ocropus/),因为它是由goog制作的! – 2010-10-11 03:41:19

+0

@Tony和@matt我想自定义编写它来实现我的项目。 – AAA 2010-10-11 03:44:25

回答

4

OCRTools是我使用的.NET

对于Java,我已经在过去使用Aspire,这是非常好的,有点吓人,但。我听说过很多关于tesseract,你不妨检查一下。

如果您对答案感到困惑:您正在寻找的是光学字符识别软件的API/SDK。您在问题中提出的要求是从头开始构建OCR。这需要理解图像处理(主要是对象识别)。

+0

对Aspire有什么可怕感到好奇。你能分享吗? – 2010-10-11 06:37:25

+0

其实我从一次批量扫描Tiff图像。读它们本身是非常混乱的,我不得不使用另一个库(ImageMagick或其他)来转换它们,然后必须通过命中和试用来转换图像的小部分,并去除噪音和所有....但是那是版本1.something,现在是第4版... – lalli 2010-10-12 03:41:37