0
我正在寻求建议我应该使用Tesseract的哪个版本来训练具有独特字母的古代语言。在特性方面,该语言与阿拉伯语非常相似。它也从右到左,一些字母可以连接在单词中。换句话说,一封信可能有三种形状,取决于它是在开始,中间还是结束。它也有harakat(short vowel marks),出现在字母上方或下方。哪个版本的Tesseract用于培训新语言?
我问的原因是因为我想利用版本3.X的可用工具,但this warning关于阿拉伯语扔我离开,因为这种语言是非常相似。
对于任何熟悉Tesseract的人,您推荐使用哪种版本来训练这种语言?另外,如果您知道更好的工具,请分享它。