我正在使用OCR包从文档中提取货币金额值。偶尔小数点会被错误地作为逗号进行OCR。该软件可以进行字符替换,即开即用,但我不能用''替换所有','。因为“数千个逗号”。该软件允许编写客户脚本以验证和纠正各种语言的值。我正在使用C#。我已经尝试过多种方式来做到这一点,从子字符串替换到正则表达式替换,再到全球化和数字样式的Double.Parse等。您会推荐什么来实现所有以下转换?OCR号码格式校正和转换
12.345,67 -> 12345.67
12345.67 -> 12345.67 (no change)
12,345.67 -> 12345.67
1,234.56 -> 1234.56
1.234.56 -> 1234.56
1.234,56 -> 1234.56
123,45 -> 123.45
123.45 -> 123.45 (no change)
1234 -> 1234.00
1,234 -> 1234.00
123 -> 123.00
编辑。根据提出的问题添加更多示例。 注意:价值将以美元和美分。无需处理“十分之一美分”。 OCR的值将有两个或零小数位。
'123,456'呢? – Toto 2014-08-29 11:17:00
那么,因为这些都是美元的价值,并且不会有三位小数... 123,456 - > 123456.00 12,345 - > 12345.00 – 2014-08-29 22:36:23