我是hadoop新手。我试图运行MapReduce(用Java编程),其中的关键是多个键(文本)。我应该使用哪种类型的数组来存储这些键,然后将它们作为参数传递给outputCollector?谢谢!!!MapReduce作业中的多个键
1
A
回答
0
0
如果它只是一些文本值,我会建议只发送它们作为分隔字符串。它方便和直接。否则你可以按照Quetzalcoatl的建议去做。你可能会发现这2个问题有用: How do i set an Object as the Value for Map output in Hadoop MapReduce? How (in Hadoop),is the data put into map and reduce functions in correct types?
相关问题
- 1. 在Hadoop中链接多个MapReduce作业
- 2. HbaseTestingUtility和MapReduce作业
- 3. 剖析MapReduce作业
- 4. 编写一个空的MapReduce作业
- 5. 我们可以在Hadoop Streaming(lang:Python)中级联多个MapReduce作业
- 6. 为MongoDB调度MapReduce作业
- 7. Avro Mapreduce作业失败org.apache.avro.AvroTypeException
- 8. Mapfile作为MapReduce作业的输入
- 9. 只报告mapReduce作业的mapper中的k个最低值
- 10. 包含HTML标记的Hadoop MapReduce作业
- 11. MapReduce作业所花费的时间
- 12. GAE的MapReduce:定义参数作业
- 13. 配置的MapReduce作业提交
- 14. 如何在Scala Spark作业中的多个键上使用ReduceByKey
- 15. 亚马逊MapReduce没有reducer作业
- 16. python mapreduce作业返回错误
- 17. 停止MapReduce作业,RunningJob#killJob vs YarnClient#killApplication
- 18. 远程启动Amazon Elastic MapReduce作业?
- 19. Hadoop MapReduce作业权限被拒绝
- 20. 如何远程运行mapreduce作业
- 21. 从jsp运行mapreduce作业servlet
- 22. 将多个连续HBase查询的结果传递给Mapreduce作业
- 23. 在MapReduce作业中通过Reducer中的文本输入值迭代多次
- 24. 什么是两个mapreduce作业的管道?
- 25. Mapreduce combinefileinputformat java.lang.reflect.InvocationTargetException当两个作业访问相同的数据时
- 26. MapReduce作业使用Python的MRjob产生前10个值
- 27. 连接到Eclipse中的Hortonworks VM for MapReduce作业的ConnectTimeoutException?
- 28. 在简单的MapReduce作业中的开销过大
- 29. Hadoop:如何在Hadoop的mapreduce类中将多个列设置为键和多个列作为值
- 30. MapReduce作业失败 - 线程“main”中的异常java.io.IOException:java.net.ConnectException
如果列表并不复杂,那么你可以在一个逗号分隔字符串键并将其设置为传递给outputCollector的文本对象。然后在缩减器中分出键来获取多个键的列表。 – Amar 2013-04-11 16:51:40