我有一个tiff文件及其上的文本,它已在早期阶段被OCR。这些单词有其确切位置作为信息(左上角,右下角)。我现在需要阅读用户绘制的矩形内的文本。从字位置检测文本列
普通段落都没有问题,但我不知道我应该如何处理文本列。如果有两个段落相邻,则将该行作为单个行将会使结果不可用。
是否有算法来帮助我按照正确的顺序放置单词?我猜测我必须检查单词之间的空格以检测识别列的模式。我想避免直接处理图像,尽管它应该是可能的(但没有OCR)。
我也不确定列表/表格的影响,例如,在订单&票据。面向行的方法在这里可能会更好。
我在Delphi开发,但在其他语言的适应算法也将不胜感激。
编辑:我会尝试后的样本数据的明天,但基本上我有话数组,在图像上各自的坐标(我可以很容易地画出他们周围的矩形,例如)。
示例数据将使得提供有用答案变得更容易。 – Argalatyr