辻さん こんにちは、山内です。 5)が正常に終わっているとのことですので、マスターに昇格したスレーブとの同期は正しく実行されていると思いますので、 再起動して、スレーブ起動しようとしているpacemakerのリソース起動中に何か起きていると思われます。 RAが2度startされているとのことですが、ログなど拝見出来ればなにかわかるかも知れません。 以下の点、とりあえず、確認して見た方が良いかと思います。 1)STONITHは組み込まれていると思いますが、マスターノードは正常にフェンシング終了して、再起動しているでしょうか? 2)corosync/pacemakerのsystemdの自動起動が有効になっていたりしませんでしょうか? 以上、よろしくお願いいたします。 > ----- Original Message ----- > > From: "辻 真吾" <tsuji****@ryobi*****> > To: "LINUX-HA" <linux****@lists*****> > Cc: "d-ike****@ryobi*****" <d-ike****@ryobi*****> > Date: 2022/06/03 金 16:29 > Subject: [Linux-ha-jp] Pacemakerのフェールオーバー後のノード組込みについて > > > 初めて投稿させていただきます。 > 辻と申します。 > > DBサーバ(PostgreSQLレプリケーション構成)を > Pacemaker+Corosyncを使用してHAクラスタ構成としています。 > > クラスタ構成において、フェールオーバーを発生させて、 > その後に、ダウンさせたノードの組込みを実施したところ、 > 組込みに失敗するという事象が発生しております。 > > 初期状態のノードを以下の構成として、実施した手順を記載いたします。 > - マスターノード:ノード1 > - スレーブノード:ノード2 > > 実施手順 > 1. ノード1のpostgresプロセスをkill > 2. ノード2がマスターに昇格 > 3. ノード1のpacemaker、corosyncをsystemctlで停止 > 4. ノード1でテーブル空間のディレクトリ配下とPGDATAのディレクトリを削除 > 5. ノード1でpg_basebackupを実施 > $ /usr/pgsql-14/bin/pg_basebackup -h <ノード2> -D $PGDATA -Xs -P -n > 6. ノード1のcorosync、pacemakerをsystemctlで起動 > → ここでノード1が"sync"状態になる想定ですが、 > 実際には起動処理が実施された後に、 > 停止状態に遷移してしまいます。※ > > ※ > 手順6の起動を実施した際に、RAのpgsqlでstart処理が二度呼ばれています。 > 一度目のstartは正常終了していますが、二度目のstartが異常終了して、 > 停止状態に遷移しています。 > > 使用しているバージョンは以下の通りです。 > corosync : 3.1.5-1 > pacemaker: 2.1.0-8 > pcs : 0.10.10-4 > PotgreSQL: 14.1 > > 原因と対処方法などをご存じの方がおられましたら、ご教授ください。 > よろしくお願いいたします。 > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > https://lists.osdn.me/mailman/listinfo/linux-ha-japan >