1つのトリガーを2回検知
いつもお世話になっております。shin19と申します。
zabbixにて1つのトリガーを2回検知するという事象が起こりました。
pingを40秒間隔で実施。4回連続NGだった場合に障害として検知という設定を行っております。
zabbixのバージョンは2.0.4で、監視対象は約3000です。
正常時:
19:30:00 ping down検知
19:38:00 ping up検知
事象発生時
19:30:00 ping down検知 (1回目)
19:30:40 ping down検知 (2回目)
19:38:00 ping up検知
アイテム:トリガーは1:1で、トリガーを複数登録しているということはございません。
事象も常に起こるわけでは無く、まれに発生するという状況です。
verによる動作不具合でしょうか。若しくは監視数や更新間隔による負荷でしょうか。
お手数ですが、アドバイスを頂けると助かります。
どうぞよろしくお願いいたします。
TNK - 投稿数: 4744
どのようなトリガーを作成されているのかをお教えください。
また、そのトリガーに対応するアイテムの値として、トリガーの条
件式内で参照すると思われる時間範囲での値の推移もお教えくださ
い。
shin19 - 投稿数: 47
TNK様
お世話になります。ご返信ありがとうございます。
トリガーの条件式は以下の通りです。
({ホスト名:icmpping[,1,,,50].last(#1)}#1)&({ホスト名:icmpping[,1,,,50].last(#2)}#1)&({ホスト名:icmpping[,1,,,50].last(#3)}#1)&({ホスト名:icmpping[,1,,,50].last(#4)}#1)
アイテム(ping)の値の推移は以下のとおりとなります。
YYYY/MM/DD 08:36:49 0
YYYY/MM/DD 08:36:09 0
YYYY/MM/DD 08:35:29 0
YYYY/MM/DD 08:34:49 0 トリガー検知
YYYY/MM/DD 08:34:09 0 トリガー検知
YYYY/MM/DD 08:33:29 0
YYYY/MM/DD 08:32:49 0
YYYY/MM/DD 08:32:09 0
YYYY/MM/DD 08:31:29 1
YYYY/MM/DD 08:30:49 1
YYYY/MM/DD 08:30:09 1
YYYY/MM/DD 08:29:29 1
YYYY/MM/DD 08:28:49 1
YYYY/MM/DD 08:28:09 1
YYYY/MM/DD 08:27:29 1
どうぞよろしくお願いいたします。
fripper - 投稿数: 495
トリガー設定の「障害イベントを継続して生成」項目は「無効」となっていますよね?
ご報告頂いているトリガー設定の場合に、「継続して生成」が有効な場合には
08:34:09 時点での評価で、#1,#2,#3,#4 がすべて0となり、トリガー初発報
08:34:49 時点での評価でも、#1,#2,#3,#4 がすべて0となり、トリガー再発報
08:35:29 時点での評価でも、#1,#2,#3,#4 がすべて0となり、トリガー再発報
08:36:09 時点での評価でも、#1,#2,#3,#4 がすべて0となり、トリガー再発報
‥
といった流れの動作になってしまいますので‥、「継続して生成」が有効ならば、
「なぜ 08:35:29 時点で発報がなかったか」が焦点になってしまいますので‥(汗)
#ちなみに、今回のような、0/1 の判定結果で、「過去n回全てが0」「過去n回全てが1」の判定には
# max(#4)#1 や min(#4)=0 などの式を用いると、トリガー記述の中に書くアイテム定義数を
#減らすことができてラクかもです
## 少し読み解きしにくくなってしまいますが‥(汗)
shin19 - 投稿数: 47
fripper様
ご返信ありがとうございます。
「障害イベントを継続して生成」は「無効」となっております。
たまにですが、やはり事象が発生してしまいます。
監視数が多いのと、pingの間隔が短い、というのが原因でしょうか。。。
max(#4)#1 や min(#4)=0などの情報、ありがとうございます。
かなりスマートになりますね。試しに使ってみようと思います。