2011-03-10 56 views
1

我正在处理批处理问题。解决方案需要处理失败的硬件。Gridgain故障转移的主(发件人)节点

有主节点(它启动任务执行)和执行作业的工作节点。我知道工作节点的故障转移如何工作,但我找不到有关主节点故障转移的任何信息。只要主节点启动任务失败,整个任务就会被取消。

有什么办法可以完成任务处理呢?

你能否提出实现主节点故障切换的最佳方式?

亲切的问候, 库巴

回答

2

每当你的主节点死了,基本上就没有人来执行的MapReduce任务的的“减少”的一步。

有几种方法可以尝试减轻这个问题:

  1. 保存使用GridCheckpointSpi(GridTaskSession.saveCheckpoint(..)API)中间检查点,当你的任务节点崩溃后重新启动的话,你可以检查如果有一个检查点被保存并从它开始。

  2. 与(1)中的相同,但改为使用数据网格(GridCache API)。

  3. 如果您不关心“减少”,请让您的工作忽略“取消”调用,并让他们在完成后将结果保存在数据网格中。

- 最佳