pingリソースのfail-countについて (Linux-ha-jp) - Linux-HA Japan

nakaさん

こんにちは、山内です。

詳細はログを見てみないとわかりませんが、
Pacemaker1.0系のpingリソースで利用しているattrd_updater（attrdプロセスへの属性更新）の仕様上、
故障検知よりも、故障カウントのアップが遅れることが原因だと思われます。

propertyに「crmd-transition-delay」パラメータがありますので、これを5sなどと設定してみてください。
これにより、全体的に故障発生時のフェイルオーバーが5s程度遅れてしまいますが、故障カウントの制御は
うまくいくはずです。

CentOS6.2とOS環境が古いですが、可能であれば、Pacemaker1.1系の利用をご検討されることをお勧めします。

以上です。


----- Original Message -----
> From: Keisuke Nakamura <k.xna****@gmail*****>
> To: linux****@lists*****
> Cc: 
> Date: 2016/11/25, Fri 14:03
> Subject: [Linux-ha-jp] pingリソースのfail-countについて
> 
> 関係者各位
> 
> お世話になっております。nakaと申します。
> 
> 環境：
> CentOS 6.2(x86_64)
> pacemaker-1.0.12-1.el6.x86_64
> heartbeat-3.0.5-1.1.el6.x86_64
> 
> (質問)
> pingリソースのfail-countについて質問です。
> pingリソースを利用しデフォルトゲートウェイへの疎通監視
> を設定している2ノードクラスタ構成を組んでおります。
> 先日弊社環境のネットワーク障害の影響で数分間、両ノードとも
> デフォゲへの疎通が不安定な状態となり、上記のpingリソースでの
> 異常を契機にクラスタグループリソースのF/Oが繰り返し行われました。
> その後ネットワークが復旧後は、繰り返し行われていたF/Oも止まり、
> サービスも正常に起動している状態となりました。
> 
> 障害直後crm_monで状態をみても、fail-countが加算されてなく
> failed actionも表示されなかったのですが、pingリソースで
> F/Oの上限回数の設定はできるものでしょうか？（例えば3回F/O
> 繰り返したら停止するとか）
> fail-countについての情報を探し出せず、当メールにてご相談
> させて頂きました。お手隙の時にご教授頂けますと幸いです。
> 
> (現状設定値の一部↓)
> primitive res_ping ocf:pacemaker:ping \
>         params name="eth0_ping_set" host_list="10.1.0.1"
> multiplier="200" dampen="1" debug="true" 
> attempts="10" \
>         op monitor interval="10s" timeout="60" \
>         op start interval="0" timeout="60"
> …中略…
> property $id="cib-bootstrap-options" \
>         dc-version="1.0.12-066152e" \
>         cluster-infrastructure="Heartbeat" \
>         stonith-enabled="false" \
>         no-quorum-policy="ignore" \
>         default-action-timeout="120s" \
>         last-lrm-refresh="1463626573"
> rsc_defaults $id="rsc-options" \
>         resource-stickiness="INFINITY"
> 
> 以上、宜しくお願い致します。
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>

Linux-HA Japan Forkpm_logconv-cspm_diskdpm_logconv-hbpm_extrasdocpm_crmgenvm-ctlpm_kvm_tools

[Linux-ha-jp] pingリソースのfail-countについて

Linux-HA Japan
Fork
pm_logconv-cs
pm_diskd
pm_logconv-hb
pm_extras
doc
pm_crmgen
vm-ctl
pm_kvm_tools