2017-05-08 94 views
1

我的需求是我需要使用张量流从图像(jpg)中读取OCR文本。 我尝试通过下载下面的项目并尝试执行代码。张量流中的ocr实现

https://github.com/tensorflow/models/tree/master/attention_ocr

我能够执行train.py但无法测试的完整流程。我想训练和测试100个样本图像。任何人都可以分享如何进一步深入细节。

仅供参考: 早些时候我使用pytesser API,但准确度非常低。它无法阅读各种尺寸的文字。

回答

1

要在FSNS数据集运行

python eval.py --dataset_name=fsns --split_name=test 

它将运行为--num_batches评价(默认100)倍--batch_size图像(默认32)测试的模型。

如果你想测试它在您自己的数据,你有三种选择:

  1. 将它转换成same format as FSNS和重用fsns.py
  2. 不要转换的数据定义mynewdatasetname.py,但写类似fsns.py一个自定义的数据集文件(见get_split功能
  3. 编写自定义脚本来export训练的模型和一个自定义脚本的eval /应用做了评价。这里有some tips for that

请注意,FSNS培训的Attention OCR模型将能够在法国抄录街道名称标志,而不仅仅是随机文本。