大量メッセージ出力時対応について
いつも参考にさせていただいております。
================
zabbix 4.4
RHEL 7.6
================
先日、zabbixサーバに特定のサーバから大量のログがゲストサーバより送られてディスク使用率が急増する状況がありました。
ディスクがフルになることは無かったのですが、コンソールにて以下の画面を開くことが出来なくなりました。
・「監視データ」→「ダッシュボード」
・「監視データ」→「障害」
※最新データや設定等の画面は正常に開くことが出来ます。
また、上記画面を開こうとするとメモリ使用率がすぐに100%になってしまいます。
サーバ再起動をしてメモリを開放しても、問題の画面を開こうとすると画面は開けず、
メモリ使用率も100%になってしまいます。
上記の現象についてご教授いただきたいのですが、
①問題の画面はトリガーで検知したメッセージを表示する画面という認識でよいのでしょうか。
②問題の画面は大量に出力されたメッセージを表示しようとDBへアクセスしているためにメモリを大幅に使用しているのでしょうか。
③上記現象を解消するにはどのような対応が必要でしょうか。
以上、よろしくお願いいたします。
Yasumi - 投稿数: 380
基本的に大量にアラートが出ても画面が固まることはそうないと思います。
画面に表示できるイベントの件数を過大にしているのではないでしょうか。
ama - 投稿数: 76
Yasumi様
ご返信ありがとうございます。
表示できるイベント件数は変更したことがありません。
ちなみに、「管理」 >「 一般設定」 > 「表示設定」の「検索/フィルターの項目の上限値」は1000となっております。
上記設定は、ダッシュボードや障害項目の表示件数とは異なるのでしょうか。
Yasumi - 投稿数: 380
表示件数はそこではなく、「ユーザー設定」⇒「ユーザー」の「ページあたりの表示行数」の設定になります。
ama - 投稿数: 76
Yasumi様
「ユーザー設定」⇒「ユーザー」の「ページあたりの表示行数」は50件となっておりました。
Yasumi - 投稿数: 380
Zabbixサーバのエラーログには何か記録されていますでしょうか。
あるいは一度、大量のログが格納されているアイテムのヒストリをクリアしてみてはどうでしょうか。
Yasumi - 投稿数: 380
原因ですが、ログ監視などで「障害」ステータスのイベントが大量に残留しているのではないでしょうか。
そのことによって、problemテーブルが肥大化し、イベントに関連する画面の表示ができなくなっているのだと思います。
大量に出力されているトリガーのステータスを復旧させるか、トリガーを一時的に削除することによって解消するはずです。