我已使用Azure HDInsight群集中的coordinator.xml调度了oozie工作流程。oozie工作流正在调度Azure HDInsight Spark2群集中的每个1分钟而不是10分钟
由oozie计划的火花作业的时间间隔为10分钟,但我的火花作业每隔一分钟运行一次。
我coordinator.properties:
startTime=2017-07-04T12:49Z
endTime=2017-07-05T12:44Z
timeZone=UTC
concurrency=1
frequency=12
workflowRoot=${oozie.coord.application.path}
nameNode=wasb://[email protected]s.net
jobTracker=hn0-edmspa.xxxsdf.hx.internal.cloudapp.net:8050
queueName=default
oozie.use.system.libpath=true
Spark_Master=yarn
Spark_Mode=cluster
Spark_Driver=locationDataMetrics.IdentificationMetrics
numExecutors=2
driverMemory=4G
executorMemory=2G
executorCores=2
workflowRoot=wasb://[email protected]et/datainput9
oozie.coord.application.path=wasb://[email protected]et/datainput9
sparkJar=demospark-0.0.1-SNAPSHOT.jar
我coordinator.xml文件:
<coordinator-app end="${endTime}" frequency="${frequency}" name="oozieTimeCoordinator" start="${startTime}" timezone="${timeZone}" xmlns="uri:oozie:coordinator:0.1">
<controls>
<concurrency>${concurrency}</concurrency>
</controls>
<action>
<workflow>
<app-path>${workflowRoot}</app-path>
</workflow>
</action>
</coordinator-app>
我怎么能修改此Oozie的工作流调度在10或15分钟安排?
定义“频率”的另一种方法是使用CRON表示法,例如, '5月15日* * * *'将在每个小时4次开始工作流程,时间为05 - 20 - 35 - 50分钟。这有点更可预测。参看https://oozie.apache.org/docs/4.3.0/CoordinatorFunctionalSpec.html#a4.4.3._Cron_syntax_in_coordinator_frequency –