多数の監視をもつzabbixを起動する場合について
いつもお世話になっております。
下記につきまして、ご教授いただきたく、よろしくお願い申し上げます。
------------------------------------------------------------------
【環境】
・本番機
zabbix2.4.7
登録ホスト数約1500
登録アイテム数約40000
・予備機
同上(ただし、設定情報のみで、監視データなし)
------------------------------------------------------------------
本番機から取得したzabbixの設定のみのダンプを予備機にリストアし、
予備機を起動したところ負荷が急激に高くなり、アラートが多数発生しました。
※アラートが発生しつづけるため、zabbix server プロセスは停止しました。
その時は、unreachable processes 等がビジーになっていましたので、
一時的に応答がないところがいくつかあり、負荷が高くなったのではないかと
考えています。
しかし、本番機では応答があった設定なので、予備機で起動しても
通信できるはずと考えていましたが、このような状況になったのは、
一度に多数の監視が開始されようとし、負荷が高くなり、応答遅延が発生し、
unreachable processes 等がビジーなったという考え方で正しいでしょうか。
その場合、多数の監視設定がある場合は、予備機を起動する際、
開始する監視を少しずつに制限し、ゆっくりと起動するという方法を
とらなければならないでしょうか。
動いている zabbix server のプロセスを stop、start した際は、
このような状況にはなりませんが、下記のような条件の場合は、
新規に設定を追加したときと同様に、一度に監視が開始されるという
動きになるかどうかご教授いただければ幸いです。
①設定のみで監視データが無い場合、全ての監視設定が初めて
監視を開始したと判定される。
②監視データがあるないに関係なく、長時間zabbix server プロセスを
起動していない場合は、全ての監視設定が初めて監視を開始したと
判定される。
以上、よろしくお願い申し上げます。
wakaba - 投稿数: 228
広瀬です。
SIA本家の有償サポート利用すれば、設定だけ抜き出して入れ直す仕組みはあったと思いますが、
それを利用されないで、設定のみ抜き出してリストアして使うと既存監視データとの不整合が
発生し、正常な監視が行われないのは仕様としかいえません。
※DBに入るデータは設定や監視生データだけではなく、各種のチェックポイントや状態なども
多数入ってます。
尚、フルリストアしなかったとしても停止期間中のデータが無いため、例えばnodata関数を多用
しているトリガーがあるとすれば、そのトリガーは概ねエラー吐きますね。
z1000 - 投稿数: 21
広瀬様
ご教授ありがとうございました。
大変よく分かりました。
予備機にはフルリストアでデータを反映させたいと思います。