主（发送方）节点的 Gridgain 故障转移

【问题标题】：Gridgain failover of master (sender) node主（发送方）节点的 Gridgain 故障转移
【发布时间】：2011-03-10 12:57:11
【问题描述】：

我正在处理批处理问题。解决方案需要处理故障硬件。

有主节点（启动任务执行）和执行作业的工作节点。我知道工作节点的故障转移是如何工作的，但我找不到有关主节点故障转移的任何信息。每当启动任务的主节点失败时，整个任务都会被取消。

那有没有办法完成任务处理呢？

您能否建议实现主节点故障转移的最佳方式？

亲切的问候，库巴

【问题讨论】：

标签： mapreduce parallel-processing grid-computing gridgain

【解决方案1】：

每当您的主节点死亡时，基本上没有人来执行您的 MapReduce 任务的“减少”步骤。

有几种方法可以尝试缓解此问题：

使用 GridCheckpointSpi (GridTaskSession.saveCheckpoint(..) API) 保存中间检查点，然后当您的任务在节点崩溃后重新启动时，您可以检查是否保存了检查点并从它开始。
与 (1) 相同，但使用数据网格 (GridCache API)。
如果您不关心“减少”，让您的工作忽略“取消”调用，并让他们在完成后将结果保存在数据网格中。

--最佳

【讨论】：

猜你喜欢

2016-03-19
2013-12-30
1970-01-01
1970-01-01
2015-03-21
1970-01-01
1970-01-01
1970-01-01
1970-01-01

相关资源

下载 2021-06-06
下载 2023-01-27
下载 2022-12-31

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode