我使用Kettle编写了ETL过程。它执行从操作数据源(Windows上的MS SQL)到数据仓库(Ubuntu上的MySQL)的数据传输。Schedule Kettle作业
我想安排日常执行工作水壶(其他),用于填充维度表和事实表的表,有我的实际数据并准备分析和报告。
我该如何计划执行水壶工作?
我将非常感激这些信息。谢谢大家。
我使用Kettle编写了ETL过程。它执行从操作数据源(Windows上的MS SQL)到数据仓库(Ubuntu上的MySQL)的数据传输。Schedule Kettle作业
我想安排日常执行工作水壶(其他),用于填充维度表和事实表的表,有我的实际数据并准备分析和报告。
我该如何计划执行水壶工作?
我将非常感激这些信息。谢谢大家。
在你的水壶安装目录下有几个批处理文件,其中spoon.bat
,pan.bat
和kitchen.bat
。 Spoon
是您已知的UI,pan
是从命令行运行转换(.ktr
文件)的命令行工具,kitchen
是运行水壶作业(.kjb
文件)的命令行工具。
对于一个简单的计划创建一个批处理文件,调用kitchen.bat或pan.bat(取决于您是否要运行转换或作业)。然后使用Windows任务计划程序以您想要的时间表运行您的批处理文件。
例如,这将运行一个水壶的工作,使用基本日志和日志内容附加到一个日志文件
kitchen.bat /file:"c:\etl\my_first_job.kjb" /level:Basic > c:\etl\logs\logging_for_my_first_job.log
这当然是对的窗户。如果您在linux上运行水壶,则可以在水壶安装目录(pan.sh
或kitchen.sh
)中使用cron和相应的.sh文件。
由于kettle会在用户配置文件中存储共享数据库连接,请确保运行计划任务的用户在其配置文件中包含这些连接,否则您的转换将失败。
pentaho中的调度是由carte服务器完成的。 http://wiki.pentaho.com/display/EAI/Carte+User+Documentation
使用你的开始步骤params调度和carte服务器,你将能够安排这个水壶工作,当你想要的。
非常感谢您的回答!这很有趣,我会阅读,谢谢。 –
欢迎您,一旦您的carte服务器启动,您将能够通过carte远程服务器中的水壶执行操作,并从START步骤参数中进行调度(在开始步骤中指定计划作业) – jipipayo
非常感谢您的快速解答! –
正是我在找的东西......第一个......谢谢! – cbmeeks