我想了解如何使用KFS作为Hadoop中的文件系统进行mapreduce。Mapreduce如何在KFS上发生?
#./bin/start-mapred.sh
如果map/reduce作业/任务服务器都在涨,所有的I/O工作将KFS。
因此,假设我的输入文件分散在不同的节点(服务器的Kosmos),我(使用KFS作为文件系统Hadoop的客户端)如何发出MapReduce的命令?
此外,在发出Mapreduce命令后,我的hadoop客户端会将来自不同服务器的所有数据提取到本地计算机,然后执行Mapreduce或在计算机上启动TaskTracker守护程序, )定位并在那里执行Mapreduce? 请纠正我,如果我错了,但我想输入文件的位置顶部Mapreduce是由函数getFileBlockLocations(FileStatus,长,长)返回。
非常感谢您的时间和帮助我。
问候, 尼基尔
你提的Kosmos文件系统(KFS) – azzaxp 2013-02-22 06:38:54
是。感谢您的回复,但我仍然不清楚Mapreduce究竟在哪里发生? – user2095164 2013-02-22 07:51:43
Chk my已更新的答案。 – azzaxp 2013-02-22 09:41:14