多数の監視をもつzabbixを起動する場合について

いつもお世話になっております。
下記につきまして、ご教授いただきたく、よろしくお願い申し上げます。

------------------------------------------------------------------
【環境】
・本番機
 zabbix2.4.7
 登録ホスト数約1500
 登録アイテム数約40000

・予備機
 同上(ただし、設定情報のみで、監視データなし)
------------------------------------------------------------------

本番機から取得したzabbixの設定のみのダンプを予備機にリストアし、
予備機を起動したところ負荷が急激に高くなり、アラートが多数発生しました。
※アラートが発生しつづけるため、zabbix server プロセスは停止しました。

その時は、unreachable processes 等がビジーになっていましたので、
一時的に応答がないところがいくつかあり、負荷が高くなったのではないかと
考えています。

しかし、本番機では応答があった設定なので、予備機で起動しても
通信できるはずと考えていましたが、このような状況になったのは、
一度に多数の監視が開始されようとし、負荷が高くなり、応答遅延が発生し、
unreachable processes 等がビジーなったという考え方で正しいでしょうか。

その場合、多数の監視設定がある場合は、予備機を起動する際、
開始する監視を少しずつに制限し、ゆっくりと起動するという方法を
とらなければならないでしょうか。

動いている zabbix server のプロセスを stop、start した際は、
このような状況にはなりませんが、下記のような条件の場合は、
新規に設定を追加したときと同様に、一度に監視が開始されるという
動きになるかどうかご教授いただければ幸いです。

①設定のみで監視データが無い場合、全ての監視設定が初めて
 監視を開始したと判定される。

②監視データがあるないに関係なく、長時間zabbix server プロセスを
 起動していない場合は、全ての監視設定が初めて監視を開始したと
 判定される。

以上、よろしくお願い申し上げます。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。

広瀬です。

SIA本家の有償サポート利用すれば、設定だけ抜き出して入れ直す仕組みはあったと思いますが、
それを利用されないで、設定のみ抜き出してリストアして使うと既存監視データとの不整合が
発生し、正常な監視が行われないのは仕様としかいえません。

 ※DBに入るデータは設定や監視生データだけではなく、各種のチェックポイントや状態なども
  多数入ってます。

尚、フルリストアしなかったとしても停止期間中のデータが無いため、例えばnodata関数を多用
しているトリガーがあるとすれば、そのトリガーは概ねエラー吐きますね。

ユーザー z1000 の写真

広瀬様

ご教授ありがとうございました。
大変よく分かりました。

予備機にはフルリストアでデータを反映させたいと思います。