Zabbix Serverの冗長化について

いつもお世話になっております。

Zabbixの冗長化というと、DRBD+Pacemakerが有名だと思いますが、DRBDもPacemakerも運
用するには少々難易度が高いという印象です。正常にFailoverすれば良いのですが、失敗した場合は
運用担当に復旧させるのは荷が重い。

そこで、GlusterFS+monitを使えば、もうちょっと楽になるのではないかと考えてみました。
データのロストは無視するとして、運用イメージは以下となります。

1. GlusterFSでデータレプリケーションしつつ、monitでプロセス監視
2. Zabbixが死んだらmonitで自動復旧 OR 失敗したらアラート
3. 手動で復旧。失敗するなら、stabdby機で起動

何か致命的な見落としや気になる点がありましたら、ご指摘いただけますと幸いです。
以上よろしくお願い致します。

※追記
サーバの電源断等の場合はこの方法ではダメですね。
失礼しました…

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。

広瀬です

Heartbeat、Pacemaker等を利用してすでに4年は経過していますが、システムのSPOFを極力
減らすには一番効果的な組み合わせかなとは思います。
Pacemaker/Corosyncになると確かに様々なパラメータが多いので、非常に理解し難いのは確
かかと思います(MySQLのソース版を組み込むのは苦労しました)。

 ※ってか、HA構成組んでいても落ちたためしが無いので、メンテん時くらいしか役に立ってま
  せんが、サービス停止時間は極端に少なくて済む事と、コマンド一発で終わりです。

ご質問の件ですが、当該の組み合わせという点も理解はするのですが、ZabbixServer部分の
冗長化自体を捨てている分けでは無いと見受けられます。
この場合仮想IPが必要になると思うのですが、スタンバイ側切り替えた場合のIP切り替えはど
のようにお考えなのでしょうか?手動でIP差し替えでしょうか?

停止してしまったサーバ側では今までのIPが残って居る状態なので、保守後再起動などすると、
IPが競合しかねません(シングル起動で書き換えてからとなると、iLOやDRAC等のリモートコン
ソールが必要かと思います・・・実機が手元にあるなら話しは別ですが)

その辺が少し気になりました。

※追伸
ああ、電源断時ではダメってお気づきだとは思うので、その辺に関わると思います。