1
A
回答
0
这是可能的。当猪脚本由Oozie运行时,它将作为单图映射缩减作业运行,该作业仅运行猪脚本,然后运行其他映射减少作业(当猪以mapred
模式运行时)。
看来,Pig动作配置不允许在本地模式下运行,但您仍然可以使用shell动作类型以本地模式运行Pig脚本。您只需确保您的脚本,输入和输出数据都在HDFS中。
0
我不认为,我们可以从oozie以本地模式运行猪。维沙尔写的评论是有道理的。在某些情况下,如果数据量较少,最好在本地模式下使用猪。要以本地模式运行,您可以通过编写shell脚本并在crontab中安排它来运行。如果您通过oozie尝试此操作。根据我的知识,这将不太合适,因为Oozie是为了在HDFS中运行。
如果你想oozie运行一些数据。它预计数据将在HDFS中(即分布式)。而且您必须在hdfs.s中拥有猪脚本。我从AlanGates看到帖子,他提到PIG用于处理来自/到HDFS的数据,而配置单元用于本地到HDFS或HDFS到HDFS。
相关问题
- 1. 使用Oozie运行级联
- 2. 执行算术运算Pig
- 3. oozie:运行数百个并行工作
- 4. 从oozie运行但没有在命令行运行时,Sqoop失败
- 5. 从Pig中提取一行
- 6. 从失败节点重新运行的Oozie协调器动作
- 7. 运行oozie fork时出现LeaseExpiredException
- 8. 运行shell脚本oozie动作
- 9. Oozie协调员动作重新运行
- 10. 在oozie shell动作中运行猪
- 11. 通过oozie运行shell脚本
- 12. 使用JAVA和UNIX运行Pig命令
- 13. Apache Pig,程序运行问题
- 14. 错误从Oozie的
- 15. Bigquery命令从oozie工作流程运行失败
- 16. Oozie shell操作 - 从shell问题运行配置单元问题
- 17. Oozie工作流程并行运行不同的表集
- 18. Oozie的java的行动
- 19. 从Java应用程序执行Pig
- 20. 从Oozie工作流程运行的mapreduce中的HBase连接失败
- 21. PIG命令执行
- 22. PIG生成空行
- 23. 通过JVM选项指向Oozie Workflow中Pig Action中的log4j.properties文件
- 24. 从Pig中的另一行中减去一行的值
- 25. 未能在HDP 2.5.0中的Oozie上运行Spark操作(java.lang.IllegalArgumentException:Invalid ContainerId)
- 26. 自动控制运行类似Oozie作业的数量
- 27. 如何使用oozie-4.1.0运行正常的“HelloWorld.java”Java操作?
- 28. Oozie中的Sqoop作业无法运行Hive导入
- 29. 如何在将来的日期运行oozie工作流程
- 30. 对存储在Hive中的数据运行Pig查询
感谢您的回答 但本地模式下的Pig从本地文件系统加载/存储数据而不是HDFS。 保持对hdfs的猪是有道理的,但在hdfs doest上的输入和输出路径有意义吗? 你能告诉我如何为它编写oozie工作流程吗? –
你应该知道Oozie是如何运行的。它使用一个映射器和不含reducer的map-reduce作业运行猪或shell脚本。因此,执行节点是从map-reduce集群中随机选择的。所以你不能说在哪个节点上运行你的脚本。因为使用本地文件系统没有意义,所以使用HDFS是因为它在所有节点上都可用。以“hdfs:// namenode:port/path/to/file”的形式使用完整URI来引用猪脚本中的HDFS路径。 –
如果您在Oozie的本地模式下运行猪时提供了一些推理,那将非常有用。 –