【发布时间】:2012-05-22 08:00:02
【问题描述】:
谁知道 GitHub 在使用 Resque 时如何处理 Redis 服务器的潜在故障或暂时不可用?
还有其他人似乎已经将半复杂的解决方案放在一起,作为使用 zookeeper 的 redis-cluster 的保留(请参阅https://github.com/ryanlecompte/redis_failover 和 Solutions for resque failover redis)。其他人似乎有“糟糕的故障转移”,即在第一眼看到连接问题时就将从属切换到主控,而没有 redis 客户端之间的协调(但这在临时不可用的情况下似乎有问题)。
问题:Defunkt 是否讨论过 GitHub 如何处理 Redis 故障?是否有不涉及 Zookeeper 的故障转移最佳实践?
关于 resque 的原始帖子指出,选择 Redis 的部分原因是 redis 的主从功能,但该帖子没有描述 GitHub 如何利用这一点,因为所有工作人员都需要对 Redis 的读+写访问权限(见https://github.com/blog/542-introducing-resque)。
【问题讨论】: