LinuxサーバをZabbixエージェントで監視しています。
サーバでtmxbcというサービスが稼働しています。
tmxbcサービスが停止してから、5分間サービス復旧がなかった場合にアラートを飛ばしたいと考えています。
以下テンプレートを作成し、サーバに実装しました。
テンプレート名は、tmxbc
アイテムキー名は、proc.num[tmxbc]
トリガー名は、min(/tmxbc/proc.num[tmxbc],5)=0
で設定すれば期待通りの動作をすると思いましたが、5分経過してもアラートが飛びません。
どの箇所を修正すればいいでしょうか?
TNK - 投稿数: 4754
その「tmxbc」のプロセスの数が1以上であることでサービスが稼働している
と判断できるということですね。
言い換えれば、プロセスの数が0だと、サービスが稼働していないということ
ですね。
そして、トリガーの条件式として、
min(/tmxbc/proc.num[tmxbc],5)=0
と設定されているようですが、5分間での評価をされたいのであれば、min()
の2つ目の引数は、「5m」にすべきではないでしょうか?
あと、5mに変更したとして、その条件式では、例えば、
時刻 値
10:00 0
10:01 0
10:02 1
10:03 1
10:04 0
10:05 0
という時系列での値の変化であったときに、最小値は0なので条件式を満たして
しまうでしょう。
それは、「5分間サービス復旧がなかった場合」ではないのではありませんか?
ですので、
最大値が1より小さい
もしくは、
最大値が0
にすることで、5分間継続してサービスが起動していなかったことを検出できると
思います。
最後に、質問される場合は、使用されているZabbixのバージョンを明記してください。
muray2025jp - 投稿数: 2
TNK様
ご教授いただきありがとうございます。
ご指摘の通り設定後、意図した通りにアラートが発報されたことを確認しました。
質問の不備について申し訳ありません。当方のZabbix-Serverバージョンは6.0.33になります。
大変助かりました。
改めて御礼申し上げます。