Kiichi Kaneko
kiich****@gmail*****
2009年 8月 22日 (土) 22:03:53 JST
山内さん こんばんは、金子です。 > ipmiのSTONITHを私は使った事がないのですが。。。 > ipmiのSTONITHのstatus(do_ipmi)の中で、ipmitoolを叩いていますが、この応答がない為に、 > タイムアウト(timeout=120s)が発生しているというのが内部の動きになります。 回答ありがとうございます。ipmitool 自身のタイムアウトなんですね。勉強に なりました。 > ha.cf内にha-log(もしくは、ha-debug)のログ設定をしていらっしゃれば、そちらのログを見た方が > わかり易いと思います。 ログ設定はしているのですが、既存で動いているシステムなので検証することは できません。 ipmi をサポートしている H/W がすぐに用意できないので ssh STONITH で動作 を確認してみます。 以上、よろしくお願い致します。 金子 renay****@ybb***** さんは書きました: > 金子さん > > こんにちは、山内です。 > > >>> この意味が、STONITHの疎通確認(モニター動作)という意味でしたら、stonithリソースの >>> monitorのinterval値になります。 >>> >> 質問のしかたが悪く申し訳ございません。STONITHの疎通確認の意味になります。 >> > > やはり、そうでしたか。。。 > 私の方でも勘違いをしていて申し訳ありませんでした。 > > >> cib.xml を確認したとこと下記のようになっています。この場合、60秒間隔で疎 >> 通確認を実施して >> STONITHの疎通ができなくなって120秒後にSTONITHが働き再起動する動きでしょうか >> > > ipmiのSTONITHを私は使った事がないのですが。。。 > ipmiのSTONITHのstatus(do_ipmi)の中で、ipmitoolを叩いていますが、この応答がない為に、 > タイムアウト(timeout=120s)が発生しているというのが内部の動きになります。 > > ha.cf内にha-log(もしくは、ha-debug)のログ設定をしていらっしゃれば、そちらのログを見た方が > わかり易いと思います。 > > Heartbeatを使った構成では、DCノードといわれる状態遷移を決定するノードがありますので、そちらのログ > (もしくは、DCノードが停止して、新たにクラスタ構成から選択されたDCノードのログ)にSTONITH実行の様子 > が出力されていると思います。 > > > 以上、よろしくお願いいたします。 > > > > > --- Kiichi Kaneko <kiich****@gmail*****> wrote: > > >> メイトリックス 山内さん >> >> >>>>> 2.) ハートビート通信で対向ノードと疎通が取れなくなったときという漠然と >>>>> した条件はわかるのですが、ping 疎通の確認をどれぐらいの間隔で実施してい >>>>> て何回反応がはいと"dead" と判断してシステムを再起動するかなどのレベルの >>>>> 情報を探しています。 >>>>> >>>>> >>> この意味が、STONITHの疎通確認(モニター動作)という意味でしたら、stonithリソースの >>> monitorのinterval値になります。 >>> >> 質問のしかたが悪く申し訳ございません。STONITHの疎通確認の意味になります。 >> cib.xml を確認したとこと下記のようになっています。この場合、60秒間隔で疎 >> 通確認を実施して >> STONITHの疎通ができなくなって120秒後にSTONITHが働き再起動する動きでしょうか >> >> <primitive id="reset_XXXX" class="stonith" type="external/ipmi" >> provider="heartbeat"> >> <operations> >> <op id="reset_XXXX-monitor" name="monitor" interval="60s" timeout="120s" >> disabled="true" prereq="nothing"/> >> <op id="reset_XXXX-start" name="start" timeout="120s" prereq="nothing"/> >> </operations> >> >> 以上、よろしくお願い致します。 >> 金子 >> >> renay****@ybb***** さんは書きました: >> >>> 金子さん >>> >>> もしかすると私の勘違いの回答だったと思い。。。追記しておきます。 >>> >>> >>> >>>>> 2.) ハートビート通信で対向ノードと疎通が取れなくなったときという漠然と >>>>> した条件はわかるのですが、ping 疎通の確認をどれぐらいの間隔で実施してい >>>>> て何回反応がはいと"dead" と判断してシステムを再起動するかなどのレベルの >>>>> 情報を探しています。 >>>>> >>>>> >>> この意味が、STONITHの疎通確認(モニター動作)という意味でしたら、stonithリソースの >>> monitorのinterval値になります。 >>> また、pingの反応については、利用するSTONITHモジュールによって違いがあるはずです。 >>> ※Heartbeat2.1.4のssh,xen0のSTONITHモジュールでは、ping数は1回となっていますが。。。 >>> >>> 以上、よろしくお願いいたします。 >>> >>> --- renay****@ybb***** wrote: >>> >>> >>> >>>> 金子さん >>>> >>>> すいません、間違えて途中で、送信してしまいましたので、再度返信します。 >>>> >>>> こんばんは、メイトリックスの山内です。 >>>> >>>> >>>> >>>>> STONITH が何を条件に再起動/停止するか調べているのですが、 >>>>> インターネット上に良い資料がありませんでした。 STONITH の >>>>> 動作に関する資料はないでしょうか。 >>>>> >>>>> >>>> あまり日本語の資料でよいものはないようです。 >>>> >>>> >>>> > Heartbeatではありませんが(といっっても、今後はHeartbeatに変わる事になる組み合わせの一部ですが)、Pacemaker > >>> >>> >>>> の >>>> サイトにDejan氏の簡単なドキュメントがありますので、一部、参考になるかも知れません。 >>>> >>>> http://www.clusterlabs.org/wiki/Documentation >>>> >>>> >>>> >>>>> 質問内容 >>>>> 1.) ハートビート通信以外の条件で STONITH が動作する条件が知りたいです。 >>>>> >>>>> >> A1)クラスタ構成時の最初の起動でのSTONITH(Startup-fencing),リソースのon-fail属性にfencingを指定した >> >>>> >>>> >>> 場 >>> >>> >>>> 合などに動作します。 >>>> >>>> >>>> >>>>> 2.) ハートビート通信で対向ノードと疎通が取れなくなったときという漠然と >>>>> した条件はわかるのですが、ping 疎通の確認をどれぐらいの間隔で実施してい >>>>> て何回反応がはいと"dead" と判断してシステムを再起動するかなどのレベルの >>>>> 情報を探しています。 >>>>> >>>>> >> A2)ハートビート間隔は、ha.cf内のkeepalive値です。ノード斷を判断するのは、ha.cf内のdeadtime経過にな >> >>>> >>>> >>> り >>> >>> >>>> ます。 >>>> >>>> 以上、よろしくお願いいたします。 >>>> >>>> --- Kaneko Kiichi <kiich****@gmail*****> wrote: >>>> >>>> >>>> >>>>> 初めまして金子と申します。 >>>>> >>>>> CentOS に heartbeat をインストールして STONITH の >>>>> 設定をしています。 >>>>> >>>>> STONITH が何を条件に再起動/停止するか調べているのですが、 >>>>> インターネット上に良い資料がありませんでした。 STONITH の >>>>> 動作に関する資料はないでしょうか。 >>>>> >>>>> 構成 >>>>> OS : Cent OS 5.2 >>>>> Ver : heartbeat 2.1.4 >>>>> サーバにimpi機能があるためimpi機能を利用してシステムが再起動 >>>>> する設定をしています。 >>>>> >>>>> 質問内容 >>>>> 1.) ハートビート通信以外の条件で STONITH が動作する条件が知りたいです。 >>>>> 2.) ハートビート通信で対向ノードと疎通が取れなくなったときという漠然と >>>>> した条件はわかるのですが、ping 疎通の確認をどれぐらいの間隔で実施してい >>>>> て何回反応がはいと"dead" と判断してシステムを再起動するかなどのレベルの >>>>> 情報を探しています。 >>>>> >>>>> 何卒宜しくお願い致します。 >>>>> 金子 >>>>> >>>>> >>>>>> _______________________________________________ >>>>>> >>>>>> >>>>> Linux-ha-japan mailing list >>>>> Linux****@lists***** >>>>> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan >>>>> >>>>> >>>>> >>>> _______________________________________________ >>>> Linux-ha-japan mailing list >>>> Linux****@lists***** >>>> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan >>>> >>>> >>>> >>> _______________________________________________ >>> Linux-ha-japan mailing list >>> Linux****@lists***** >>> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan >>> >>> >> _______________________________________________ >> Linux-ha-japan mailing list >> Linux****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan >> >> > > _______________________________________________ > Linux-ha-japan mailing list > Linux****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan >