watchdogによる「database is down」検出の挙動がおかしいように見えます。(アラートメールを受信するのにzabbix_server.logには何も出力しない)
■利用している機能(watchdogによるDB監視)
現在、「一般設定」の「その他の設定パラメータ」にて、以下パラメータにて、送信先グループを設定しています。
・データベース停止メッセージの送信先グループ
従い、DB障害時は以下の動作となる認識です。
watchdogが「database is down」を検出する = アラートメールが発生 = zabbix_server.logに「database is down」が出力
■教えていただきたい内容
上記の通り設定しているのですが、
送信先のパソコンに「database is down」という件名のメールが届いて、あわててサーバにログインして確認しても、
zabbix_server.logには何も出力していません。
また負荷でも上っているかと、zabbix側のサーバ、mysql側のサーバ(RDS)をそれぞれ確認してもリソースやIO、NWともに問題ないレベルです。
加え、実際にDBをダウンさせたらどうなるかと先ほどmysqlの再起動を試したのですが、以下のような真逆な状態となりました。
・zabbix_server.logに「database is down」が出力。
・送信先のパソコンには「database is down」は送信されていない。
なぜこのような事象(不一致)が発生するのか、どなたか教えていただきたく。
現状のままだと、「データベース停止メッセージの送信先グループ」は当てにできない機能としてOFFにするしかないのかなぁと思っています。
ちなみに直近2か月で10件超のアラートメール(database is down)を受信しているのですが、どれもこれもzabbix_server.logには何も出力していませんでした。housekeeperさんが一定時間ごとに頑張っているぐらいです。
■利用している環境
Zabbix Version :Zabbix3.0.10 (AWS EC2: Amazon Linux AMI release 2016.03)
mysql Version : MySQL5.7.17 (AWS RDS)
■参考
以下を拝読してみたのですが、私が遭遇している事象には一致していない気がしました。
http://www.zabbix.jp/node/2594
zab-SR - 投稿数: 14
申し訳ありません。
この投稿ですが、全くの誤りでした。
別担当にて作成したZabbixにて同一アドレスに対してメールを送信していたのみです。
大変お騒がせしました。