0
我必须实现一个map-reduce作业循环。每次迭代将根据前一次迭代终止或继续。要做出的选择是基于“在减速器输出中出现一个词”。Reducer可以在Hadoop mapreduce中传递给驱动程序的消息吗?
当然,我可以用我的驱动程序检查整个输出txt文件。但它只是一个单词,并且通过整个文件将会矫枉过正。我正在考虑是否有任何方法来建立减速器和驱动程序之间的通信,一旦它检测到这个词,减速器可以通知驱动程序?由于要传输的消息很少。
Mapreduce支持“计数器”的概念。或者,您可能想尝试使用Spark,以便将您正在构建到工作流而非循环中的“DAG任务” –