メール通知について

Zabbix初心者です。

アクションでのメール通知が全く同じ内容で、2件送信されてしまいます。
アイテム、トリガー、アクションの見直しを行いましたが、改善されませんでした。

以下に環境、設定を記載いたしますので、原因やアドバイス等ありましたらご教示
お願いいたします。

<OS>
CentOS7

<バージョン>
Zabbix-Server 4.0.0 alpha8

<アイテム>
キー  :vfs.fs.size[C:,pused]
更新間隔:1m

<トリガー>
トリガー名:ディスク空き容量枯渇(Cドライブ) {HOST.NAME}
条件式  :{Template System Check:vfs.fs.size[C:,pused].last()}>90

<アクション>
実行条件:メンテナンスの状態 期間外 メンテナンス
     期間 期間中 1-7,07:30-24:00
     トリガー = Template System Check: ディスク空き容量枯渇(Cドライブ) Template System Check
実行内容:デフォルトのアクション実行ステップの間隔 ⇒ 1h
     ステップ ⇒ 1-1
     ステップの間隔 ⇒ 0
※他のアクションが実行されている可能性も考慮し、他のアクションは全て無効にしております。

ちなみに前に使用していたバージョン(2.2)では全く同じ内容で、メールが2件送信されて
しまうようなことはありませんでした。
また、本サイトの過去ログにも似たような現象があったのですが、解決に至りませんでした。

以上、よろしくお願いいたします。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

メールが送付される時刻も同一ですか?
そうであるならば、アクションの宛先に指定しているユーザーと
各ユーザーのメディアの設定を確認してください。
同じメールアドレスに送ってしまうような重複設定はありません
か?

メールが送付される時刻がずれているのであれば、トリガーのイベ
ント生成モードを「複数」にしていませんか?
または、障害の通知と障害回復の通知が届いているのではありませ
んか?

「監視データ」->「障害」の画面から、該当する時刻のイベントを
クリックして、実行されたアクションの詳細も確認してみてくださ
い。

ユーザー チャーミー の写真

回答が遅くなってしまい、大変申し訳ございませんでした。

早急な回答ありがとうございます。
メールが送付される時刻も内容も同一です。
(障害復旧アクションは未設定です)

指摘の設定を見直しましたが、結果は変わらず、同様のメールが2件送信されました。

以下に、見直しをした内容を記載いたします。
・ユーザーに設定してあるメディアを1ユーザーのみに付与
・メディア設定をしたユーザーのみユーザーグループを独立
・トリガーの障害イベント生成モードは「単一」であることを確認
・「監視データ」->「障害」の画面では実行されたアクションは1度のみ
 ※アクション内容の詳細は「Problem created」の次に「Alert message」です。

以上、よろしくお願いいたします。

ユーザー TNK の写真

アクション(Actions)の通知メッセージ(Alert message)の行のユー
ザー/送信先(User/Recipient)に記載されているメールアドレスも1
つだけですか?

そうであるならば、メディアには何を使用していますか?
Zabbix標準のEmailですか?

ユーザー チャーミー の写真

アクション(Actions)の通知メッセージ(Alert message)の行のユー
ザー/送信先(User/Recipient)に記載されているメールアドレスも1
つだけですか?
⇒1つだけです。
 原因がわからないため他のアクション、他のユーザーのメディアは
 無効化しております。

Zabbix標準のEmailですか?
⇒Email、Zabbix Mailのどちらも試しましたが、結果は変わりませんで
した。

よろしくお願いします。

ユーザー TNK の写真

「Zabbix Mail」というのはZabbix標準の物ではないので内容がわ
かりませんが、同じメールサーバーを使用しているのであれば、そ
のメールサーバーが再送しているという可能性はありませんか?

可能であれば、メールサーバーのログをご確認ください。

ユーザー チャーミー の写真

2.2と4.0でメールサーバーの変更はしませんでしたが、
一応メールサーバーのログを調査してみます。

あと、ZabbixServer側で障害を検知したからアクション
を実行したよ。
というようなログはどこかにありますか?

よろしくお願いします。

ユーザー TNK の写真

あと、ZabbixServer側で障害を検知したからアクション
を実行したよ。
というようなログはどこかにありますか?

そのログが、確認頂いた「監視データ」->「障害」の画面から参照
頂いた詳細の画面に表示されたものです。
デバッグレベルを上げなければ、正常に処理できている時には、そ
れ以上のログは出力されないでしょう。

メールの送信処理も、失敗してしまった場合はZabbixサーバーのロ
グ(例:/var/log/zabbix/zabbix_server.log)に出力されますが、
メール送信に完全に失敗してしまった場合は、障害イベントの詳細
画面で送信失敗と表示されるはずです。
送信失敗になっていないのであれば、もしかしたら、Zabbix側とし
ては、一度送ろうとしたが正常な応答が得られず失敗したと判断し、
リトライを行ってメールを再度送信しようとしたのかもしれません。

その時、メールサーバー側では、1回目の処理も受け取っていて、
リトライの分と合わせて2通処理されたのかもしれません。

その場合は、何らかのログが出力されているかもしれませんので、
メールを送信した時刻前後のZabbixサーバーのログを確認してみて
ください。

ユーザー TNK の写真

エラーも出力されていないようであれば、Zabbix 4.0.0alpha9が
リリースされていますので、バージョンアップしてみてください。

ユーザー チャーミー の写真

メールサーバーのログを調査したところ、以下の違いがありました。

2.2の場合:受信1件、送信1件
4.0の場合:受信2件、送信1件

恐らく、Zabbix側から2件受信して1回で2件分送っているような挙動
でした。

Zabbix側のログレベルを変更し、再度ログを調査してみます。

それでもダメなら、バージョンアップも検討してみます。

ユーザー karna の写真

> ステップの間隔 ⇒ 0
というのが気になります。
マニュアルを見ると、0→デフォルトを使用となってますが、
α版ということなので、バグのような気もします。

適当な値を入れてみても、同じ動作となりますでしょうか?

ユーザー TNK の写真

ステップの間隔で0を指定した場合、ステップの時間間隔として、
アクションのデフォルトを使用するので、アクションの設定の実行
内容(Operations)タブ内のデフォルトのアクション実行ステップの
間隔(Default operation step duration)で指定されている時間が
使用されます。

デフォルトでは、1h(1時間)になっていたと思います。

私の手元の4.0.0alpha8,9,10では、標準のEmailを使用して2通送信
されるような現象は発生していません。

ユーザー チャーミー の写真

お世話になります。

ステップの間隔を 0 → 60
と適当な値にしましたが、現象は変わりませんでした。

あと、気になった点が、アクションの実行条件で「トリガーの値」が
なくなっていました。
(バージョンの関係なのかα版だからなのかわかりませんが)

今まで2.2を使用していた際は、アクションの実行条件には必ず、
「トリガーの値 = 障害」
という条件を入れていて、メールも意図した結果で送信されてきました。

もしかすると、トリガーの値が判断できず、「正常」、「異常」の2回
分でメールが送信された可能性もあるのでしょうか?

よろしくお願いいたします。

ユーザー TNK の写真

あと、気になった点が、アクションの実行条件で「トリガーの値」が
なくなっていました。
(バージョンの関係なのかα版だからなのかわかりませんが)

Zabbix 3.4以降では、障害発生と障害回復(実行内容と復旧時実行
内容)は別タブでの設定に分離されています。
そのため、実行条件にトリガーの値を入れる必要がありません。

障害発生時なのか、障害復旧時なのかを明確にするためには、通知
の件名かメッセージ内にマクロの{TRIGGER.STATUS}を入れてみてく
ださい。

ユーザー チャーミー の写真

メッセージ内にマクロの{TRIGGER.STATUS}を入れてみましたが、
やはりどっちも「PROBLEM」でした。