具体而言,我想要更改Microsoft Azure上运行的HDInsight群集中每个节点的最大映射器数量和最大减少器数量。如何配置和重新启动在Azure上运行的HDInsight群集?
使用远程桌面,我登录到头节点。我编辑了头节点上的mapred-site.xml文件,并更改了mapred.tasktracker.map.tasks.maximum和mapred.tasktracker.reduce.tasks.maximum值。我尝试重新启动头节点,但我无法重新启动。我使用start-onebox.cmd和stop-onebox.cmd脚本来尝试启动/停止HDInsight。
然后我运行流式mapreduce,将所需数量的reducer传递给hadoop-streaming.jar,但减法器的数量仍受上一个mapred.tasktracker.reduce.tasks.maximum值限制。我的大多数减速器都在等待执行。
是否需要更改每个节点上的mapred-site.xml文件?有没有简单的方法来改变这种情况,还是我需要远程桌面到每个节点?如何重新启动或重新启动群集,以便使用我的新值?
感谢