我是hadoop的新手,我对此有以下问题。Hadoop任务可以在单个节点上并行运行
这就是我在hadoop中理解的。
1)当过任何文件写入Hadoop中它存储所有数据节点的数据块(64MB默认)
2)当我们运行的MR工作,分裂将从此块中创建和在每个数据节点上分割将被处理。
3)从每个分割记录读取器将被用来在映射器端生成键/值对。
问题:
1)一个数据节点可以一次处理多个分割吗?如果数据节点容量更大?
我认为这是MR1的局限性,而用MR2 YARN我们有更好的资源利用率。
2)将在数据节点上以串行方式读取拆分,还是可以并行处理以生成键/值对? [通过随机访问数据节点拆分中的磁盘位置]
3)map/reduce体系结构中的'slot'术语是什么?我正在阅读其中一篇博客,它说YARN将在Datanode中提供更好的插槽利用率。