[Linux-ha-jp] Nodes 間の通信が正しく動作しない

Back to archive index

renay****@ybb***** renay****@ybb*****
2009年 2月 25日 (水) 03:29:30 JST


こんにちは、メイトリックスの山内といいます。

私も何度かVMWare上でCentOSで構築していますが、あまりうまくいかないケースに遭遇した事がありません。

伺った環境では、ping,sshでの疎通は可能とのことですが、Heartbeatで通信をしているポート:694による通信
は可能になっておりますでしょうか?

tcpdumpなどのコマンドを使って、ポート:694の通信状態を確認してみるのも良いかと思います。

以上、よろしくお願いいたします。

--- Tatsuo Indou <tatsu****@mtb*****> wrote:

> お世話になります。
> 
> VMware上で、CentOS5.2、heartbeatをインストールしました。仮想環境上で、二
> 代のサーバを作成し、hertbeatを試してみようと考えています。
> 
> /etc/ha.d/ha.cfと/etc/ha.d/authkeysを作成し、heartbeatを両系で実行しました。
> しばらくの後、hb_monitor を実行してみると、以下のような状態です。
> 
> ■CentOS523(正系)
> ============
> Last updated: Wed Feb 25 02:39:50 2009
> Current DC: NONE
> 1 Nodes configured.
> 0 Resources configured.
> ============
> 	Node: centos523.tsystem.gr.jp (8be21ed6-2d24-6752-ccad-83ddfe59ae12):
> online
> 
> ■CentOS524(副系)
> ============
> Last updated: Wed Feb 25 02:37:58 2009
> Current DC: NONE
> 1 Nodes configured.
> 0 Resources configured.
> ============
> 	Node: centos524.tsystem.gr.jp (939d5b4d-bc3b-60ec-e72f-f04d3ef1b5d4):
> online
> 
> リソースはまだ定義していません。このときでも、ha.cfに書かれているNodeが
> 両方ともonlineになると認識しているですが、片側が出力されませんでした。
> 
> また、Current DCはどちらも、monitorを実行したホストとなってしまいます。
> hb_monitor -e -i 1 -nにより詳細を表示してみると、
> いずれもオンライン側には、
>         === FAIL-COUNT ===
>         === INSTANCE-ATTRIBUTES ===
>         attribute (probe_complete:true)
>         === INTERCONNECT-LAN ===
>         heartbeat-comm (eth1:dead):     Heartbeat is failure !!
> のメッセージが出ています。
> ネットワークに問題があると思われ、ifconfigを実行してみますと、eth0(通常
> LAN(ブリッジ))、eth1(ハートビート用LAN(ホストオンリー))のいずれも動作し
> ていると思われます。
> 
> 互いに、逆側のホストのeth1のIPアドレスにpingは通りますし、sshによる逆側
> のホストのeth1のIPアドレスへのログインも可能です。
> ha.cf内で、debugを指定したファイル、またログファイルには、
> WARN: node 逆のノード: is dead
> と出ています。逆のノードへの通信がうまくいっていないように思えます。
> ha.cf内の、bcast eth1を、ucast eth1 逆側のホストのeth1のIPアドレス と指
> 定しても同様でした。
> 
> 初回に動作させたのち、/var/lib/heartbeat/crm/cib.xmlが作成されていました
> ので、<nodes></nodes>の間に、逆側のnodeをコピーして追記しました。
> その時には、crm_mon、hb_monitorともNodeの欄には定義したnodeは出ますが、
> 通信ができていないようですので、OFFLINEのままです。
> 
> 	Node: centos524.tsystem.gr.jp (939d5b4d-bc3b-60ec-e72f-f04d3ef1b5d4):
> OFFLINE
> 	Node: centos523.tsystem.gr.jp (8be21ed6-2d24-6752-ccad-83ddfe59ae12):
> OFFLINE
> 	
> eth1経由での通信が正しく動作していないようなのですが、どのようの対応すれ
> ば良いのでしょうか。
> 私は、ifconfigでeth1が、UPと表示さること。
> 逆側のeth1へのpingと、ssh接続で正しくネットワークは動作していると考えて
> いました。
> そのため、対処方法が思いつかない状態です。どなたか、お気づきの点ありまし
> たら、ご指摘していただけませんか。よろしくお願いします。
> 
> ■各ソフトのバージョンです。
> 
> ホストOS
> 	Windows Vista SP1
> 
> VMware
> 	VMware Workstation 6.0.5 build-109488
> OS
> 	CentOS 5.2 x86_64
> 
> heartbeat
> 	heartbeat-2.1.4-1
> 	heartbeat-gui-2.1.4-1
> 
> ■定義ファイルの内容です。
> # cat /etc/ha.d/ha.cf # 両系とも同様のファイルです。
> crm on
> debugfile /var/log/ha-debug
> logfile /var/log/ha-log
> logfacility local0
> keepalive 3
> deadtime 30
> deadping 40
> warntime 10
> initdead 60
> udpport 694
> auto_failback on
> bcast eth1
> node CentOS523
> node CentOS524
> respawn hacluster /usr/lib64/heartbeat/pingd -m 100 -d 5s -a
> default_ping_set
> uuidfrom nodename
> ping 192.168.2.193
> 
> 
> # cat /etc/ha.d/authkeys
> auth 1
> 1 sha1 Hello!
> 
> ■ha-logです。
> 090225 024431:root @ CentOS523:crm# sed -n "5533,\$p" /var/log/ha-log
> heartbeat[3853]: 2009/02/25_02:34:12 info: **************************
> heartbeat[3853]: 2009/02/25_02:34:12 info: Configuration validated.
> Starting heartbeat 2.1.4
> heartbeat[3854]: 2009/02/25_02:34:12 info: heartbeat: version 2.1.4
> heartbeat[3854]: 2009/02/25_02:34:12 info: Heartbeat generation: 1235230397
> heartbeat[3854]: 2009/02/25_02:34:12 info: seed is -2044534694
> heartbeat[3854]: 2009/02/25_02:34:12 info: glib: UDP Broadcast heartbeat
> started on port 694 (694) interface eth1
> heartbeat[3854]: 2009/02/25_02:34:12 info: glib: UDP Broadcast heartbeat
> closed on port 694 interface eth1 - Status: 1
> heartbeat[3854]: 2009/02/25_02:34:12 info: glib: ping heartbeat started.
> heartbeat[3854]: 2009/02/25_02:34:12 info: G_main_add_TriggerHandler:
> Added signal manual handler
> heartbeat[3854]: 2009/02/25_02:34:12 info: G_main_add_TriggerHandler:
> Added signal manual handler
> heartbeat[3854]: 2009/02/25_02:34:12 info: G_main_add_SignalHandler:
> Added signal handler for signal 17
> heartbeat[3854]: 2009/02/25_02:34:12 info: Local status now set to: 'up'
> heartbeat[3854]: 2009/02/25_02:34:13 info: Link
> 192.168.2.193:192.168.2.193 up.
> heartbeat[3854]: 2009/02/25_02:34:13 info: Status update for node
> 192.168.2.193: status ping
> heartbeat[3854]: 2009/02/25_02:39:35 WARN: node centos524: is dead
> heartbeat[3854]: 2009/02/25_02:39:35 info: Comm_now_up(): updating
> status to active
> heartbeat[3854]: 2009/02/25_02:39:35 info: Local status now set to: 'active'
> heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client
> "/usr/lib64/heartbeat/ccm" (498,496)
> heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client
> "/usr/lib64/heartbeat/cib" (498,496)
> heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client
> "/usr/lib64/heartbeat/lrmd -r" (0,0)
> heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client
> "/usr/lib64/heartbeat/stonithd" (0,0)
> heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client
> "/usr/lib64/heartbeat/attrd" (498,496)
> heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client
> "/usr/lib64/heartbeat/crmd" (498,496)
> heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client
> "/usr/lib64/heartbeat/mgmtd -v" (0,0)
> heartbeat[3854]: 2009/02/25_02:39:35 info: Starting child client
> "/usr/lib64/heartbeat/pingd -m 100 -d 5s -a default_ping_set" (498,496)
> heartbeat[3914]: 2009/02/25_02:39:35 info: Starting
> "/usr/lib64/heartbeat/ccm" as uid 498  gid 496 (pid 3914)
> heartbeat[3915]: 2009/02/25_02:39:35 info: Starting
> "/usr/lib64/heartbeat/cib" as uid 498  gid 496 (pid 3915)
> heartbeat[3916]: 2009/02/25_02:39:35 info: Starting
> "/usr/lib64/heartbeat/lrmd -r" as uid 0  gid 0 (pid 3916)
> heartbeat[3917]: 2009/02/25_02:39:35 info: Starting
> "/usr/lib64/heartbeat/stonithd" as uid 0  gid 0 (pid 3917)
> heartbeat[3918]: 2009/02/25_02:39:35 info: Starting
> "/usr/lib64/heartbeat/attrd" as uid 498  gid 496 (pid 3918)
> heartbeat[3919]: 2009/02/25_02:39:36 info: Starting
> "/usr/lib64/heartbeat/crmd" as uid 498  gid 496 (pid 3919)
> heartbeat[3921]: 2009/02/25_02:39:36 info: Starting
> "/usr/lib64/heartbeat/pingd -m 100 -d 5s -a default_ping_set" as uid 498
>  gid 496 (pid 3921)
> heartbeat[3920]: 2009/02/25_02:39:36 info: Starting
> "/usr/lib64/heartbeat/mgmtd -v" as uid 0  gid 0 (pid 3920)
> cib[3915]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added
> signal handler for signal 15
> lrmd[3916]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added
> signal handler for signal 15
> stonithd[3917]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler:
> Added signal handler for signal 10
> attrd[3918]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added
> signal handler for signal 15
> ccm[3914]: 2009/02/25_02:39:36 info: Hostname: centos523
> crmd[3919]: 2009/02/25_02:39:36 info: main: CRM Hg Version: fb84f606a422 tip
> 
> pingd[3921]: 2009/02/25_02:39:36 info: Invoked:
> /usr/lib64/heartbeat/pingd -m 100 -d 5s -a default_ping_set
> mgmtd[3920]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added
> signal handler for signal 15
> cib[3915]: 2009/02/25_02:39:36 info: G_main_add_TriggerHandler: Added
> signal manual handler
> lrmd[3916]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added
> signal handler for signal 17
> stonithd[3917]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler:
> Added signal handler for signal 12
> attrd[3918]: 2009/02/25_02:39:36 info: register_with_ha: Hostname: centos523
> crmd[3919]: 2009/02/25_02:39:36 info: crmd_init: Starting crmd
> cib[3915]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added
> signal handler for signal 17
> lrmd[3916]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added
> signal handler for signal 10
> stonithd[3917]: 2009/02/25_02:39:36 info: Signing in with heartbeat.
> crmd[3919]: 2009/02/25_02:39:36 info: G_main_add_SignalHandler: Added
> signal handler for signal 15
> 
=== 以下のメッセージは省略されました ===





Linux-ha-japan メーリングリストの案内
Back to archive index