oozie

    2热度

    1回答

    我需要创建一个自定义EL功能并在uri-template(相当于YEAR,MONTH)中使用它。 有可能吗?协调员这个区域的关键配置是oozie-site.xml?

    0热度

    1回答

    我的主火花项目对其他utils的依赖jars.So集组合的可能是这样的: 1. main_spark-1.0.jar will work with utils_spark-1.0.jar (some jobs use this set) 2. main_spark-2.0.jar will work with utils_spark-2.0.jar (and some of the jobs u

    0热度

    1回答

    我有具有两个动作watcher1和watcher2叉开始Oozie的工作流程。只要其中的一个即watcher1或watcher2成功,我就需要立即加入。 有什么在Oozie的,我可以做,以实现上述提到的场景。

    0热度

    1回答

    我试图在hadoop 2.7.3上安装oozie 4.3.0,当时我试图创建oozie发行版。它出现以下错误消息失败。 at org.codehaus.plexus.classworlds.launcher.Launcher.main(Launcher.java:357) [ERROR] [ERROR] The project org.apache.oozie:oozie-main:4.3.

    1热度

    1回答

    我创建了一个pySpark工作,它的工作完全正确,提交通过spark-submit。现在,当我试图通过Oozie它的失败。我怀疑我输入的字段有问题。 Oozie中的Spark Action需要这些字段。 Spark Master : local Mode : client Main class : DO I need to enter anything here as its Python +

    0热度

    1回答

    触发多个Oozie协调员与不同的时间表我有一个问题,我需要提交多个协调员(约10),每个不同的时间表和没有依赖关系每个B /例如:每2小时一次,12小时等)。我看到有一个局限性,我们应该将协调器命名为完全没有前缀或后缀的coordinator.xml(这样我就不能区分)。我不想让我的代码复制10次(维护每个协调器的文件夹)来处理这个问题。 sample folder with multiple c

    -1热度

    1回答

    我已经安装了oozie,并且可以在oozie工作流上运行spark工作?我可以独立运行oozie bundle中的spark库,而不直接使用oozie。我该怎么做?请用一个例子来解释。

    1热度

    1回答

    我在执行sqoop export命令(在shell脚本中)时使用oozie时遇到了以下错误。 “了java.lang.RuntimeException:无法加载数据库驱动程序类:oracle.jdbc.OracleDriver” 从CLI(边缘节点) sqoop出口工作正常。 我已将ojdbc6.jar添加到以下位置。 /opt/cloudera/parcels/CDH-5.7.1-1.cdh5.

    0热度

    1回答

    我想在使用Hue的Oozie上运行一个简单的python脚本。我使用的是安装了所以我也加入了Cloudera管理器,火花的配置(火花服务高级配置片段(安全阀)的火花的conf/spark-env.sh) if [ -z "${PYSPARK_PYTHON}" ]; then export PYSPARK_PYTHON=/opt/cloudera/parcels/Anaconda/bin/pyth

    0热度

    1回答

    我们正在Oozie中开发许多不同的工作流程。我们使用3种环境,DEV,PRE和PRO。 我想要做的是在所有3个环境中保留相同的workflow.xml文件,并且只能从Cloudera环境读取数据库连接,URL,身份验证等属性。通过这种方式,可以对文件进行版本控制并轻松部署。可能吗? 使用谷歌搜索,我看到可能config-default.xml将是一个默认属性值的地方,但我在我们的Cloudera