OS再起動後、一時間Agentの監視状況が取得できない。

Zabbix 3.0.5

いつもお世話になっております。

本日5:00にSV5台について定期OS再起動を行いました。
4:55-5:10の時間帯はメンテナンス期間(データ収集有り)にしています。

メンテナンス期間内にAgentの再起動が終了している(ログで確認)為アラートメールは発砲されないはずですが、
メンテナンス後メールが発報されてしまいました。

■アラートメール状況(メンテナンス期間は除外にするようアクションで設定しています)
5:10 Agent応答不可のアラートメールが発報。
6:10 Agent応答のリカバリーメールが発報。

■トリガー状況
5:02 Agent応答 障害
5:10 Agent応答 障害
6:04 Agent応答 正常

■監視状況
~4:57 Agent Ping の応答有。
4:58~6:03 何も値がとれず。
6:04 Agent Pingの応答が復活。

※ICMP応答なし(シンプルチェック)のアラートメールはでませんでした。
■Agent Log状況
5:02に通常通り起動

■Zabbix Server Log
5099:20180308:045715.545 Zabbix agent item "net.if.in[WAN Miniport (IP)-WFP Native MAC Layer LightWeight Filter-0000]" on host SV#1 failed: first network error, wait for 55 seconds
5105:20180308:045717.108 Zabbix agent item "perf_counter[\Memory\Transition Faults/sec]" on host SV#2 failed: first network error, wait for 55 seconds
5113:20180308:045731.813 Zabbix agent item "perf_counter[\Memory\System Code Total Bytes]" on host SV#3 failed: first network error, wait for 55 seconds
5071:20180308:045731.874 Zabbix agent item "perf_counter[\Memory\Page Reads/sec]" on host SV#4 failed: first network error, wait for 55 seconds
5089:20180308:045740.671 Zabbix agent item "perf_counter[\Processor(_Total)\DPC Rate]" on host SV#5 failed: first network error, wait for 55 seconds

また、今回再起動が初めてというわけではなく、二週間前も同様のことを行っております。その際は何も問題は起こりませんでした。

原因や調査方法についてご教示頂けませんか。

(補足)
関係ないかもしれませんが、昨日行ったことについて。
・10時から17時にかけて別監視にて大量のアラートを検知してしまい、負荷がかかりました。17時30分にはメールが止まりました。
・400台のホストに対してWEB監視を新しく追加しました。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

テンプレートの「Template App Zabbix Server」を使用して、
Zabbixサーバーの各プロセスのbusy状態を確認してください。
また、キューにも溜まっていないかもご確認ください。

データベースへの負荷上昇や、プロセス数不足による処理の
滞留が発生している可能性が考えられると思います。

ユーザー poypoy の写真

データベースへの大量の書き込みとプロセス数不足が原因でした。
メモリやpollerを増やし、対象Serverを減らしたことで、現在は問題なく稼働しております。
ご教示頂きありがとうございました。