我在某些使用案例中一直没有使用减速机作业,但是我从未遇到过“无映射器”作业。 “没有Mapper”意味着mapreduce框架仍然会读取输入文件并以某种方式对它们进行排序/排序(基于InputFormat?),这些将成为我的reducer的输入?何时会需要“无映射器”?
2
A
回答
5
“无映射器”是“身份映射器”的委婉语。默认的映射器,如果你没有指定一个就是这样。至少,身份映射程序将未改变的输入引导至右缩减分区。
1
对于基于输入密钥的一些聚合函数,身份映射器是有意义的。映射器将发出与输入相同的I/O键,并且reducer将聚合特定键的值。
1
如果您在使用Hadoop的流:
-mapper "/bin/sh -c \"cat\""
相关问题
- 1. Hibernate注解映射比hbm.xml映射需要更多的时间
- 2. 需要ntdll.dll映射文件
- 3. KnockoutJS映射 - 只需填写我需要的服务器
- 4. 如何编码需要任意映射器的蚂蚁任务?
- 5. 自动映射器会议
- 6. ElasticSearch NEST手动映射需要分析
- 7. 的std ::映射更比需要对比
- 8. 需要所有请求映射url
- 9. 需要一些休眠关系映射
- 10. 类型错误:格式需要映射
- 11. 我需要映射文件吗?
- 12. FluentNHibernate映射语法帮助需要
- 13. MFC的消息映射,不需要&?
- 14. HttpHandler是否需要一个aspnet_isapi.dll映射
- 15. 需要加速自动映射器...它需要32秒做113个对象
- 16. 如何对象映射器时间戳映射到最新
- 17. NHibernate - 无需映射即可加入
- 18. POJO无需JSON字符串映射
- 19. 需要多个数据映射器的域对象
- 20. 需要SqlAlchemy单表继承的经典映射器示例
- 21. 将实体映射到视图时是否需要@NamedQuery?
- 22. doctrine2映射所需
- 23. 何时使用映射框架,何时手动映射?
- 24. 无BiMap映射和反向映射
- 25. BizTalk映射:源记录不存在,但需要映射并传递默认值
- 26. 将会运行多少个映射器?
- 27. 为什么映射器会抛出ArrayIndexoutofboundexception?
- 28. 打印时会话映射为空
- 29. 当源中不存在属性时自动映射器映射
- 30. 在映射器