意図しない通知(PROBLEM)が発生してしまう ファイルの更新有無確認
お世話になります。satouです。
ファイルの更新有無をdelta関数を用いて
行うことを考えていたのですが、少しうまくいかず質問させてください。
別によい手段がございましたらありがたいです
■現象
意図しない通知(PROBLEM)が発生してしまう
ファイルの更新が無かった場合に通知を出すように
したいが、更新があるにも係わらず、PROBLEM通知が発生してしまう。
■望む状態
通知②のみ出る状態としたい。
通知①の出る原因を除去したい。
■アイテム
hostname:vfs.file.time[hoge.log,modify]
データ型:数値
形式:10進数
更新間隔:30秒
保存期間:90日
■トリガー条件
{hostname:vfs.file.time[hoge.log,modify].delta(7200)}=0&
{hostname:vfs.file.time[hoge.log,modify].time(0)}>010000&
{hostname:vfs.file.time[hoge.log,modify].time(0)}<010500
■hoge.logの実際の更新タイミング
hoge.log 2015/05/30 0:11更新
■発生通知
①:PROBLEM発生 2015/05/30 1:00
Trigger: トリガー名
Trigger status: PROBLEM
Trigger severity: Average
Trigger URL:
Item values:
1. トリガー名 (hostname:vfs.file.time[hoge.log,modify]): 1432912274
2. トリガー名 (hostname:vfs.file.time[hoge.log,modify]): 1432912274
3. トリガー名 (hostname:vfs.file.time[hoge.log,modify]): 1432912274
Original event ID: 198276
②:OK発生 2015/05/30 1:05
Trigger: トリガー名
Trigger status: OK
Trigger severity: Average
Trigger URL:
Item values:
1.トリガー名 (hostname:vfs.file.time[hoge.log,modify]): 1432912274
2. トリガー名 (hostname:vfs.file.time[hoge.log,modify]): 1432912274
3. トリガー名 (hostname:vfs.file.time[hoge.log,modify]): 1432912274
Original event ID: 198288
すみませんが、よろしくお願いいたします。
KAZ - 投稿数: 1085
satouさん
質問の際はZabbixのバージョン・マイナーバージョンを書い頂けますか?A(^^;
で、& < >などのHTML特殊文字はエスケープかけてくれますか?
文章崩れます。
※:質問はエスケープかけておきました。
また、通知ってことはアクションが動いた際の動作についての質問だと思うのですが、
アクションの実行条件書いて貰えますか?
satousan - 投稿数: 10
すみません追記いたします
■環境
server:CentOS Linux release 7.1.1503
zabbix:Zabbix server v2.2.7 (revision 50148)
client:windows7
zabbix-agent:2.2.7
■アクションの実行条件
(A) and (B or C)
ラベル 名前 アクション
(A) メンテナンスの状態 期間外 メンテナンス
(B) トリガーの値 = 障害
(C) トリガーの値 = 正常
■アクションの実行内容
ユーザーグループにメッセージを送信: Zabbix administrators via Email
よろしくお願いいたします
TNK - 投稿数: 4753
トリガーの値は異常だけにしてみてください。
正常もorで加えてしまうと障害回復時にもアクションが実行されて
しまうと思います。
satousan - 投稿数: 10
ご返答ありがとうございます
トリガーの変更を試してみようと思います
一方で、
>{hostname:vfs.file.time[hoge.log,modify].delta(7200)}=0&
>{hostname:vfs.file.time[hoge.log,modify].time(0)}>010000&
>{hostname:vfs.file.time[hoge.log,modify].time(0)}<010500
の部分で、1時以前は
偽&
偽&
正
で偽となり、
1時~1時5分で
偽&
正&
正
で偽となり
1時5分以降
偽&
偽&
偽
で偽となるかと考えていましたが
なぜ、トリガー値を障害・正常の二種類を設定することで
発報するのかがいまいち分かっておりません。
トリガー値に関連するなにか関係があるのでしょうか
よろしくお願いいたします。
TNK - 投稿数: 4753
とりあえず、アクションの実行条件の部分のみです。
アクションの実行条件に、「トリガーの値=正常」を追加してしま
うと、アクションのメッセージで、リカバリメッセージを有効にし
てリカバリメッセージをカスタマイズしていても、障害回復時に、
リカバリメッセージの方ではなく、デフォルトのメッセージの方が
使用されてしまいますのでご注意ください。
つまり、トリガーの値として正常と障害の両方を指定してしまうと、
障害発生時と回復時のメッセージの内容をカスタマイズして別の内
容のメッセージを送ることができません。
障害発生時に障害発生通知を行い、障害回復時に回復メッセージを
送られたいのであれば、
・アクションの実行条件には「トリガーの値=障害」を指定
・アクションの実行条件には「トリガーの値=正常」を指定しない
・アクションの設定のリカバリメッセージにチェックをする
・必要に応じてリカバリ時のメッセージもカスタマイズする
という設定の方がよいと思います。
あと、障害と判定されてしまうのは、トリガー条件式の
{hostname:vfs.file.time[hoge.log,modify].delta(7200)}=0
の部分の問題だと思われますが、これから確認してみます。
satousan - 投稿数: 10
ご返信ありがとうございます。
現状、ファイルの更新があったことを確認することが解決したい点となりまして、
deltaを使用したのは、私が、これしか思い浮かばなかったためです。
何卒よろしくお願いいたします。
KAZ - 投稿数: 1085
satouさん
ファイルの更新の確認ならvfs.file.cksumやvfs.file.md5sumを使ってはどうですか?
以下、マニュアルになります。
1 Zabbixエージェント
https://www.zabbix.com/documentation/2.2/jp/manual/config/items/itemtype...