2015-12-24 38 views
3

当使用起搏器和corosync时,我遇到了故障计数问题。如何配置“用起搏器清除过期的故障计数”时间

我的/ var/log/messages文件:

Dec 23 22:19:36 node1 attrd[1922]: notice: attrd_perform_update: Sent update 81: fail-count-named=1 

我最新的故障计数在12月23日22点19分36秒。

但经过几分钟:

Dec 23 22:34:47 node1 pengine[1923]: notice: unpack_rsc_op: Clearing expired failcount for named:0 on node1 
Dec 23 22:34:47 node1 pengine[1923]: notice: unpack_rsc_op: Re-initiated expired calculated failure named_last_failure_0 (rc=7, magic=0:7;21:32:0:f1d80836-3649-45c5-abd5-8c7d4ef5d7f9) on node1 

故障计数已被删除。大约需要15分钟。

我cib.xml:

<nvpair id="rs-resource-stickiness" name="resource-stickiness" value="300"/> 
<nvpair id="rs_defaults_migration-threshold" name="migration-threshold" value="3"/> 
<nvpair id="rs_defaults_failure-timeout" name="failure-timeout" value="60s"/> 

我不知道在哪里失效计数到期存储的时间,我该如何配置或删除呢?

回答

2

我们可以结合cluster-recheck-intervalfailure-timeout当我们需要配置自动失效失败计数。当我们想要禁用它时使用failure-timeout=0