zabbixのイベントの時間異常について
はじめまして、tabitoと申します。現在、zabbixの監視メール通知に関して問題があり、
皆様のお知恵をお借りしたいと思い投稿致しました。
【監視メール通知概要】
・サーバーリソースの定時通知メールの送信
→ex.15時にメールでリソースの状況を通知
※1 現在のメール送信用トリガーの設定は下記の通り。
トリガーA
-------ここから-------
{serverA:vm.memory.size[available].time(0)}<150200
&{serverA:vm.memory.size[available].time(0)}>150000
&{serverA:vm.memory.size[available].avg(60)}<0
・
・
-------ここまで-------
※2 メール送信アクションの設定は下記の通り
-------ここから-------
アクション実行のステップ間隔 300
リカバリメッセージ OFF
アクション実行条件(全てand)
(a)トリガー=トリガーA
(b)トリガーの値=障害
(c)トリガーの深刻度=情報
ステップ 1(開始・終了)
ステップ間隔 0
-------ここまで-------
【問題】
・トリガーが2度誘発し、メールが2通送信されてしまう。
→イベントを確認したところ、以下のようなトリガーの状態推移を確認。
2015/XX/XX 15:00:04 トリガーA 障害 1m56s ←2度目のトリガー
2015/XX/XX 15:00:00 トリガーA 正常 2s ←なぜか出現する時間の異常なイベント
2015/XX/XX 15:00:02 トリガーA 障害 2s ←1度目のトリガー(想定通り)
2015/XX/XX 14:59:47 トリガーA 正常 23h58m2s ←前日からの状態
上記のような症状は必ずではなく、時折出現します。また、開始後に「正常」が挟まるパターンと、
終了後に「異常」が挟まるパターンを確認しております。
いずれもイベントの時間が、後発イベント<先発イベントとなる現象に起因しております。
下記の2つのうちどちらかで対応できると考えていますが、具体的な手段を見つけることができませんでした。
(1)イベントの時間問題を解決する
(2)トリガーの条件を組み合わせて、2度目のアクションを誘発させない(一定時間はアクションを行わない設定等)
どうか、よろしくお願いします。
TNK - 投稿数: 4742
利用されているZabbixのバージョンをお教えください。
次に、各サーバの時刻同期は行われていますか?
ntpなどを利用されている場合、そのタイミングで時刻調整が実行され
ていたりしませんか?
それと、最新データで該当するアイテムのタイムスタンプはどうなっ
ていますか?
設定されている間隔通り取得できていますか?
あと、トリガーの条件式はこれだけですか?
もし省略されているのであれば、それらも極力ご提示ください。
イベントの画面に関しても、各イベントの詳細も確認してみてください。
特にアクションのメッセージ内でITEM.VALUEを参照している箇所がある
ならば、それらの各イベントのアクションのメッセージ内の内容を時系
列に比較してみてください。