我在Excel文件(和csv文件)中有大量数据。数据需要放入数据库(mysql)。但是,在进入数据库之前,需要处理它。例如,如果列1小于列3,则将列4添加到列2.在信息持续存在之前,必须遵守相当多的规则。在数据库之前处理数据的应用程序设计
什么是一个好的设计来完成这项任务? (用java)
其他备注
流程需要被自动化。从某种意义上说,我不必手动进入和更改数据。我们正在谈论数千行数据,每行有15列信息。
目前,我有一种责任设计链的设置。每个规则的一个类(Java)。当一个规则完成时,它会调用以下规则。
更多信息
通常有每个数据片约5000行。速度不是一个巨大的问题,因为这个大的输入不经常发生。
我已经考虑过流口水,但是我不确定这个任务对于流程来说足够复杂。
实施例的规则:
所有货币(在特定列中的数据)不能包含货币符号。
类别名称必须一致(如书案=书柜)
入学日期不能是将来的日期
文本输入只能包含[AZ 0-9 \ s]的
等。
此外,如果任何一列信息无效,则需要在 处理完成时报告 (或者可能停止处理)。
我目前的解决方案工作。不过,我认为还有改进的空间,所以我正在寻找 的理想,以了解如何改进以及其他人如何处理类似 的情况。
我已经考虑过(非常简单地)使用口水,但我不确定工作是否足够复杂以利用流口水。