Zabbix agent on hostname is unreachable for 5 minites

いつもいろいろ助けられています。

1か月に1回ほど二日間以下のメッセージが大量に出てzabbixが安定していません。

Zabbix agent on hostname is unreachable for 5 minites

サーバのプロセスはSQLがかなり占めており、古いDBのデータを消したりなど
整理を行っているせいでサーバのIOが追いついていないのではないかと予想していますが、
同じような状況が起こる方はいますでしょうか。
なお、サーバは仮想にいれているため少し実機よりディスクのIOが遅いかもしれません。
運用初めて1年以上は経っています。

OS Cent7系
ver 4
ノード数100くらい
DBのサイズは50G以上

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー Yasumi の写真

安定しないのはAgent側でよかったでしょうか。あとZabbixのバージョンですね。

一旦トリガー閾値を大きくしてみてはどうでしょうか。
Agentの情報取得不可時間が、許容範囲に収まっていないと思われる場合は、サーバ自体の動作を改善するしかないと思います。

ユーザー bochimeshi の写真

監視か5分を伸ばす手もありますね。参考になりました。

zabbixサーバのホストの監視をしたところ、書き込みと読み込みに大量の遅延が出ていることがわかりました。

ノード数と監視項目が多すぎるせいかかなりサーバに負担になっていたようです。

仮想にしていることもあるので、サイジングは難しいですね。

本件解決できましたので、クローズと致します。