我仍然试图弄清楚什么时候使用Hadoop合并器类(我看到一些文章,但他们没有特别的帮助我的情况)。用于文本的Hadoop合并器类
我的问题是,当对的值是Text类时,是否适合使用组合器类?举例来说,假设我们从映射器的输出如下:
fruit apple
fruit orange
fruit banana
...
veggie carrot
veggie celery
...
我们可以将一个组合类这里是:
fruit apple orange banana
...
veggie carrot celery
...
甚至达到减速过吗?
呃,如果这就是你希望你的reducer接收你的数据......那么是的。 – 2012-04-08 18:41:40
@BrianRoach减速器基本上是做组合器会做的事情,如果可能的话。你能否详细说明你的答案?作为一个免责声明,我有一个任务,我的教授问我们为什么一个组合器类不能被引入类似于上述例子的情况。不过,我觉得好像可以,这就是我问的原因。 – honeywind 2012-04-08 19:25:44