我有一个包含表document
的数据库。该表定义了我将处理的文档的路径。
文档的处理非常繁重,可能需要几分钟时间处理单个文档。
我有超过20万个文件需要处理。
文档托管在生产应用程序中。所以我必须每晚处理它们。
我的问题是:是否可以定义一个弹簧批处理作业,从数据库查询文档(未处理)并处理它们,然后安排该作业(使用Quartz)在上午8点停止并在晚上8点?在指定的时间间隔内运行弹簧作业
编辑
我想我应该让自己更清楚:
我的问题是关于:我应该有一个任务来处理所有的文件,并使其在一天结束的日常生活和重启停止。或者我应该让这份工作每次只处理一份文件?现在,我只用一个工作来遍历所有文档(因为我是Spring批处理文档),所有我发现的例子都在讨论读取整个表(使用读取器)和处理数据。
如果这是一种好方法,那么我该如何中断作业执行到一天结束时才能继续。
或者我应该只用一份文件?
您是否有大概的时间来完成一个文件?如果是的话,我认为你可以达到你想要的效果 – 2013-04-26 11:31:25
不,我不知道。我的问题是:我是否应该有一份工作来处理所有文件,并使其每天停止并在当天结束时重新开始。或者我应该让这份工作每次只处理一份文件? – 2013-04-26 13:04:59