我在运行猪脚本/ map-reduce作业方面有几个问题。Apache PIG问题
我知道,猪创造逻辑,物理,然后执行计划它真的开始执行的map/reduce作业之前;我能够使用命令解释<alias_name>查看逻辑/物理计划;但是,我如何查看执行计划(我想列出计划的不同地图/减少任务)?在执行猪的过程中,我看到创建了许多作业(地图/缩小对)。想要了解每项工作解决什么问题。
是否有任何明确的指导,我可以用它来了解所创建的计划,因为什么是特困是难以理解的。
我可以通过更改输入文件块的数量来更改地图作业的数量。我是否也可以控制减少工作的数量?我如何设置减速器的数量?
mapper/reducer节点中的默认堆内存大小是多少?哪些工作参数反映了这些?我可以通过-Xmx 1024m选项更改堆内存吗?当我以这种方式设置堆内存时,我的作业常常失败 - 可能会对可以提供的值有一些限制吗?
非常感谢!
这也是值得注意的是,您可以设置号码在陈述本身中,特定经营者的减排者。例如。 'B = A组由PARALLEL 18组成;' – HXCaine