2016-06-07 66 views
2

我们尝试更新aerospike版本并出现一个奇怪的问题。 我们有3 - 节点集群版本3.5.4和复制因子2Aerospike迁移中止

我们决定更新到3.8.2.3,所以我们新的服务器上安装新版本,并加入集群新节点,迁移后我们删除旧节点。一切都很完美。

我们决定重复我们的算法。 我们增加了一个新的节点到集群,并看到迁移失败。我们在下面的日志中发现了很多错误。

Jun 06 2016 22:43:26 GMT: WARNING (partition): (partition.c::2221) {namespace:3368} migrate rx aborted. During migrate receive start, duplicate partition contains primary version 

此外,我们看到了复制的该计数对象比原产对象,例如:

我们的迁移配置

所以,我们如何解决这个问题?

回答

2

我从输出中看到没有任何正在进行的迁移。副本计数与主要计数不匹配。

之前的3.7.0.1前一轮迁移可能会干扰后续轮次。我怀疑这是发生在这里。我建议您现在继续升级并忽略这些问题。如果完成计数仍然不匹配,则需要强制分区重新同步。

要强制分区重新同步,请执行以下命令。

asadm -h [NODE IP] -e "cluster dun all"; 
sleep 10; 
asadm -h [NODE IP] -e "cluster undun all"; 

这将导致所有分区版本发散和重新同步。