我有一个4节点的RedShift集群。RedShift节点故障切换
- 当其中一个节点出现故障时,整个群集将不可用?
- 如果是 - 多长时间?
- 当群集恢复时 - 是否返回到故障发生前的相同点,或者数据可能会从几小时前回滚到S3快照?
- 我该如何模拟这种情况来自行检查这个场景?
非常感谢!
我有一个4节点的RedShift集群。RedShift节点故障切换
非常感谢!
如果是单节点故障 - 亚马逊将启动一个新节点并从其他节点流数据(如果有的话,每个节点将写入两个不同的节点)。 在这种情况下,我们可以预计:
如果有多个节点发生故障,红移将从最新的S3备份中恢复自身。 S3备份在下列情况完成:
它恰好发生在我的群集 - 其中一个节点失败。花了将近20分钟才能在仪表板中发现(不健康显示在“性能”选项卡中,但在“状态”选项卡中显示为健康状态)。
从初始故障1小时后,群集将其状态更改为'修改',并且在另一个1小时后新节点已到位。
有在“最新事件”的消息:
在亚马逊红移群集的节点“XXX”被自动在2013年12月18日11时42分UTC取代。群集现在正常运行。
对于整个时间群集不可用 - 没有查询运行,没有进口是可能的。
数据与发生故障时的数据完全相同。
谢谢!还有两个问题:你使用2TB还是16TB节点?集群实际使用的数据量是多少? – diemacht