トリガーやアクションの無効化のチェックについて
確認させていただきたいことがあります。
Zabbix 5.0
OS:RHEL7
Zabbix を使用して監視運用していますが、運用者がトリガーやアクションを有効化し忘れてしまったことで、
障害に気が付けない事故が発生しました。
暫定運用として、Zabbix ダッシュボードの画面から、無効化があるかを確認していますが、
作業や別件障害により暫定的に無効化にしている数が多く、
無効化されていて問題ないものとの切り分けを目視でするのが手間がかかっています。
できれば、自動化で対応したいのですが、以下のような案しか思いつきません。
もうちょっとスマートは方法を探っているところです。
・mysql のテーブルから無効化項目を抽出して、無効化で問題ないリストファイルと突合せてアラートを上げるスクリプトを作成する(cron)
・無効化の数をSQLで抽出して、1日1回、朝方にチェックして、前回から値が変わっていればアラートとするアイテムとトリガーを作成
同じような悩みを抱えていて、このような対応した。とかのナレッジがあればぜひ共有していただきたいです。
API がアイテムで使えればいいかなとも思っているのですが、思い浮かばず。。
Yasumi - 投稿数: 380
同種あるいは近種の問題を抱えているかたはいると思います。
例えば、アイテムが「取得不可」になることで障害に気づけないことがあります。
これに対処するため、アイテムの「取得不可」数を比較チェックするトリガーを作る、という例がすぐ浮かびます。
SQLから抽出せずとも、下記アイテムを利用すれば「有効状態のトリガー数」を
Zabbixインターナルで取得できますので、これをもって比較チェックするトリガーを作ることは容易です。
zabbix[triggers]
しかし、これはあくまでも対処療法的な施策です。
人為的なミスや運用上の問題をカバーするような仕組みは、本来Zabbixの役目ではありません。
トリガーやアクションを有効化し忘れるというのは運用上のチェックに起因する問題ですので、
Zabbixの機能を利用してこれを完全に解決するのは難しいと思います。
ta-ratm - 投稿数: 19
遅くなりました。
回答ありがとうございます。
「数」だとどうしても、無効化されている対象が変わってしまったときに変化に気が付けません。
「監査」メニューから無効化されていることをチェックするようにしようと思いますが、
トリガーやアクションの変更や無効化は「監査」メニューに表示されるのですが、
アイテムの変更や無効化が「監査」メニューに出てきません。
以下のドキュメントを参照すると、アイテムの操作もログに出力するように見えます。
https://www.zabbix.com/documentation/current/manual/api/reference/auditl...
これは、Zabbix の仕様かバグなのでしょうか。
それとも、なにか追加で設定が必要なのでしょうか。
Yasumi - 投稿数: 380
私の環境では正常に表示されていますね。
※無効化時:トリガー.status: 0 => 1
管理⇒一般設定⇒データの保存期間を見てはどうでしょうか
ta-ratm - 投稿数: 19
返信ありがとうございます。
> ※無効化時:トリガー.status: 0 => 1
トリガーは表示されるんですが、アイテムが表示されません。
アイテムのほうはどうでしょうか。
Yasumi - 投稿数: 380
確認しましたが、アイテムの有効化と無効化は監査ログに記録されないようです。
ta-ratm - 投稿数: 19
ありがとうございます。
他の環境でも発生しているということで、調べてみたら、以下をみつけました。。
どうやら、長年のバグのようで、他の方法を検討することにします。
https://support.zabbix.com/browse/ZBX-2815