[Linux-ha-jp] 障害発生時に片系ノードのOSからの復旧後の不要nodeの削除について

Back to archive index

kinos****@tdc***** kinos****@tdc*****
2010年 4月 12日 (月) 16:27:00 JST


木下です。

heartbeat+drbdで構築した環境で片系のサーバーが障害発生して、
OSからインストールし直さないといけない状態があったとします。

死んだサーバーのstatusは、OFFLINEのままに、OSをインストールして
heartbeatとdrbdを設定しました。

死んだサーバーを再構築して、haertbeatをstartさせた時に、以下のように
なります。

[root @ drbd1 ~]# crm_mon
Defaulting to one-shot mode
You need to have curses available at compile time to enable console mode


============
Last updated: Mon Apr 12 15:54:11 2010
Current DC: drbd1.localdomain (4cb1e44a-a722-4012-8a6a-ea2e727d9511)
3 Nodes configured.
1 Resources configured.
============

Node: drbd1.localdomain (4cb1e44a-a722-4012-8a6a-ea2e727d9511): online
Node: drbd2.localdomain (282f35cb-5f46-4573-84de-8451d26c49f8): OFFLINE
Node: drbd2.localdomain (611cf05e-eef9-4faa-8238-d288b15b1b72): online

Resource Group: group_1
    IPaddr_10_20_65_50  (heartbeat::ocf:IPaddr):        Started
drbd2.localdomain
    drbddisk_2  (heartbeat:drbddisk):   Started drbd2.localdomain
    Filesystem_3        (heartbeat::ocf:Filesystem):    Started
drbd2.localdomain
    pgsql_4     (heartbeat::ocf:pgsql): Started drbd2.localdomain
[root @ drbd1 ~]#


drbd2.localdomain(611cf05e-eef9-4faa-8238-d288b15b1b72)が新たにnodeとして
追加されたのですが、OFFLINEのnodeの
drbd2.localdomain(282f35cb-5f46-4573-84de-8451d26c49f8)を削除したいのです
が、
heartbeatのサービスを停止せずに削除が出来るのでしょうか?

今のところ、何種類かコマンドを実施しましたが、うまくいってません。

# crm_attribute -D -U drbd2.localdomain -u
282f35cb-5f46-4573-84de-8451d26c49f8
# crm_master -D -i 282f35cb-5f46-4573-84de-8451d26c49f8
# crm_master -D -U drbd2.localdomain -i
282f35cb-5f46-4573-84de-8451d26c49f8


両系のheartbeatをstopさせて、DCの系のcib.xmlを修正して、DCではない系の
cib.xmlを削除して起動すると、ダブリのnodeを削除できますが、出来れば
コマンドで動的に削除出来ればと思っています。

ご存知の方、いらっしゃったら教えてください。

環境は、以下になります。

CentOS4.8 2.6.9-89.ELsmp
heartbeat 2.1.3-3(v2モードで利用)
drbd 8.3.2-6
postgresql 8.4.1

eth0がサービスポート
eth1が同期ポート
ttyS0がシリアルの同期ポート





Linux-ha-japan メーリングリストの案内
Back to archive index