This site best when viewed with a modern standards-compliant browser. We recommend Firefox Get Firefox!.

Linux-HA project logo
Providing Open Source High-Availability Software for Linux and other OSes since 1999.

USA Flag UK Flag

Japanese Flag

ホームページ

サイトについて

コンタクト情報

使用条件

協力方法

セキュリティ

This web page is no longer maintained. Information presented here exists only to avoid breaking historical links.
The Project stays maintained, and lives on: see the Linux-HA Reference Documentation.
To get rid of this notice, you may want to browse the old wiki instead.

2010.1.28
追加パッケージ集リニューアル
追加パッケージ集は、こちらから

2008.8.28
RHEL用rpm更新
更新情報はこちらから

2008.8.18
Heartbeat 2.1.4
リリース!
Downloadはこちらから

2007.11.13
Linux-ha-japan日本語ML移植しました

2007.10.5
日本語サイトOPEN
日本語MLも開設しました

2007.10.5
OSC2007 Tokyo/Fall で Heartbeat紹介
発表資料を公開しました

Last site update:
2017-12-14 23:46:42

障害発生後にリソースを強制的に移行させるには?

2.0.5以前のバージョンでは、これを行う方法はありません。

それ以降のバージョンでは、リソースのresource_failure_stickinessプロパティ(またはグローバルデフォルトのdefault_resource_failure_stickiness)を使用して、フェイルオーバを実行するタイミングを管理します。

以下のクラスタを想定します。

  • default_resource_failure_stickiness-100

  • default_resource_stickiness500

  • スコアが1500nodeAでリソースmy_rscを実行するように設定

  • スコアが1000nodeBでリソースmy_rscを実行するように設定

my_rscについては、nodeBに移動されるまでに、nodeAで障害が発生しても10回まで許容されます。

(nodeA score - nodeB score + stickiness) / abs(failure stickiness)

==> (1500 - 1000 + 500) / abs(-100)

==> 1000 / 100

==> Answer: 10

ただし、default_resource_failure_stickiness-1001以下に設定されている場合は、すぐに移動されます。

(nodeA score - nodeB score + stickiness) / abs(failure stickiness)

==> (1500 - 1000 + 500) / abs(-1001)

==> 1000 / 1001

==> Answer: 0.999

注: 障害許容度は、マイナス値に設定する必要があります。
注: +/-INFINITYのルールが適用されます。

 INFINITY +/- -INFINITY : -INFINITY
 INFINITY +/-  int      :  INFINITY
-INFINITY +/-  int      : -INFINITY

多重障害

ノードのmy_rscの複合スコアがゼロ未満の場合、障害カウンタがリセットされるまで、再実行することはできません

現在の(特定のリソースおよびノードの)障害カウントにリソースの障害許容度をかけて、フェイルオーバスコアが生成されます。フェイルオーバスコアがノードの標準設定を超えると、リソースを再実行する対象からノードが除外されます(障害カウントがリセットされるまで)。

1つ目の例(default_resource_failure_stickiness-100)では、Heartbeatがリソースをそこで再実行しなくなるまでに、my_rscの障害が15回まで許容されます。同様に、nodeBでは、そのノードが同様に判断されるまで、10回の障害が許容されます。

2つ目の例(default_resource_failure_stickinessが-500未満)では、これらの値はそれぞれ、3回と2回の障害に減少します。

障害カウントのリセット

nodeAmy_rscの障害カウントをリセットするには、次のコマンドを使用します。

  • crm_failcount -D -U nodeA -r my_rsc

現在の障害カウントを照会するには、以下のコマンドを使用します。

  • crm_failcount -G -U nodeA -r my_rsc

リソースの移動時に障害カウントが自動的にリセットされないのはなぜですか?

リソースが2つ以上の「不良」ノード間で行き来しないよう、リソースの移動時に障害カウントは自動的にはリセットされません。