2016-08-17 86 views
2

我使用Kettle编写了ETL过程。它执行从操作数据源(Windows上的MS SQL)到数据仓库(Ubuntu上的MySQL)的数据传输。Schedule Kettle作业

enter image description here

我想安排日常执行工作水壶(其他),用于填充维度表和事实表的表,有我的实际数据并准备分析和报告。

我该如何计划执行水壶工作?

我将非常感激这些信息。谢谢大家。

回答

3

在你的水壶安装目录下有几个批处理文件,其中spoon.bat,pan.batkitchen.batSpoon是您已知的UI,pan是从命令行运行转换(.ktr文件)的命令行工具,kitchen是运行水壶作业(.kjb文件)的命令行工具。

对于一个简单的计划创建一个批处理文件,调用kitchen.bat或pan.bat(取决于您是否要运行转换或作业)。然后使用Windows任务计划程序以您想要的时间表运行您的批处理文件。

例如,这将运行一个水壶的工作,使用基本日志和日志内容附加到一个日志文件

kitchen.bat /file:"c:\etl\my_first_job.kjb" /level:Basic > c:\etl\logs\logging_for_my_first_job.log 

这当然是对的窗户。如果您在linux上运行水壶,则可以在水壶安装目录(pan.shkitchen.sh)中使用cron和相应的.sh文件。

由于kettle会在用户配置文件中存储共享数据库连接,请确保运行计划任务的用户在其配置文件中包含这些连接,否则您的转换将失败。

+0

非常感谢您的快速解答! –

+0

正是我在找的东西......第一个......谢谢! – cbmeeks

2

pentaho中的调度是由carte服务器完成的。 http://wiki.pentaho.com/display/EAI/Carte+User+Documentation

使用你的开始步骤params调度和carte服务器,你将能够安排这个水壶工作,当你想要的。

+0

非常感谢您的回答!这很有趣,我会阅读,谢谢。 –

+1

欢迎您,一旦您的carte服务器启动,您将能够通过carte远程服务器中的水壶执行操作,并从START步骤参数中进行调度(在开始步骤中指定计划作业) – jipipayo