[Linux-ha-jp] マスター側のvipが停止した原因と対処方法について

Back to archive index

mlus mlus****@39596*****
2013年 6月 18日 (火) 05:17:29 JST


外しているかもしれませんが・・・・・。

使われているハードウエアのNICのチップの不具合報告とかはないでしょうか?
また、もしかしたら、BIOSやOSの省電力の設定を確認されて見るのも、有効対策が見つからないでしょうか?



2013年6月17日 14:30 大渕昭夫 <butch****@gmail*****>:
> 初めまして。
> 大渕昭夫と申します。
>
> アドバイス等いただきたくメールさせていただきました。
>
> 内容としましては、マスター側のvipが停止してしまったことの原因と対処方法についてです。
> あまり技術的に詳しくなく、原因がわからず困っております。
>
> こちらを参考にさせていただき、PostgreSQLを冗長化すべく作業をしております。設定も構成も同じで構築しております。
> https://github.com/t-matsuo/resource-agents/wiki/PostgreSQL-9.1-%E3%82%B9%E3%83%88%E3%83%AA%E3%83%BC%E3%83%9F%E3%83%B3%E3%82%B0%E3%83%AC%E3%83%97%E3%83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E5%AF%BE%E5%BF%9C-%E3%83%AA%E3%82%BD%E3%83%BC%E3%82%B9%E3%82%A8%E3%83%BC%E3%82%B8%E3%82%A7%E3%83%B3%E3%83%88
>
>
> 現在、本番稼働中のサーバー(ptdb01)はそのままで、新サーバー(ptdb02)をMaster機として構築、しばらくptdb02のみで稼働させて、問題なければptdb01を停止し、ptdb01に同環境をインストールした後にスレーブ機として追加して、最終的に上記参考のようなMater/Slave構成にしたいと考えております。
>
> ptdb02にPacemaker1.0.13-1.1とPostgreSQL9.2.4をインストールし、6月13日に無事に稼働したのを確認いたしました。
> OSはCentOS5です。
> また、pacemaker稼働中にcrm configure のedit
> でvip-masterを変更するテストをしたのですが、その時はきちんと変更されて稼働しました。
>
> vip-masterからのデータベースへのアクセスも問題なくできていました。
>
> ところが、今朝モニターしてみると以下のような表示になり、vip-masterにアクセスできなくなっていました。
>
> ============
> Last updated: Mon Jun 17 09:29:32 2013
> Stack: Heartbeat
> Current DC: ptdb02.localdomain (2dfbfb70-566a-400c-b378-62917dee7e9e) -
> partition with quorum
> Version: 1.0.13-30bb726
> 1 Nodes configured, unknown expected votes
> 4 Resources configured.
> ============
> Online: [ ptdb02.localdomain ]
> vip-slave       (ocf::heartbeat:IPaddr2):       Started ptdb02.localdomain
>  Master/Slave Set: msPostgresql
>      Masters: [ ptdb02.localdomain ]
>      Stopped: [ pgsql:1 ]
>  Clone Set: clnPingCheck
>      Started: [ ptdb02.localdomain ]
> Node Attributes:
> * Node ptdb02.localdomain:
>     + default_ping_set                  : 100
>     + master-pgsql:0                    : 1000
>     + pgsql-data-status                 : LATEST
>     + pgsql-master-baseline             : 0000000755000080
>     + pgsql-status                      : PRI
> Failed actions:
>     vip-master_monitor_10000 (node=ptdb02.localdomain, call=19, rc=6,
> status=complete): not configured
>
>
> ha-logを確認したところ6月15日の20:22にvip-masterが止まっていました。
> 該当箇所は以下の通りです。
>
> Jun 15 20:22:48 ptdb02 cib: [19850]: info: cib_stats: Processed 2169
> operations (3416.00us average, 1% utilization) in the last 10min
> Jun 15 20:23:28 ptdb02 IPaddr2(vip-master)[30902]: ERROR: Unknown interface
> [eth0] No such device.
> IPaddr2(vip-master)[30902]: 2013/06/15_20:23:28 ERROR: Unknown interface
> [eth0] No such device.
> Jun 15 20:23:28 ptdb02 IPaddr2(vip-master)[30902]: ERROR: [findif] failed
> IPaddr2(vip-master)[30902]: 2013/06/15_20:23:28 ERROR: [findif] failed
> Jun 15 20:23:28 ptdb02 crmd: [19854]: info: process_lrm_event: LRM operation
> vip-master_monitor_10000 (call=19, rc=6, cib-update=250, confirmed=false)
> not configured
> Jun 15 20:23:28 ptdb02.localdomain crmd: [19854]: info: process_lrm_event:
> LRM operation vip-master_monitor_10000 (call=19, rc=6, cib-update=250,
> confirmed=false) not configured
>
> 以上です。
>
> なお、6月14日から6月17日の朝までは誰もptdb02にアクセスはしておりません。
>
> お忙しいところ恐縮ですが、こちらの原因と対処方法などについてご教授いただけますとありがたいです。
>
> ほかに必要な情報等あれば、ご指示いただければと思います。
>
> 以上、よろしくお願い申し上げます。
>
>
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>



Linux-ha-japan メーリングリストの案内
Back to archive index