メンテナンス時間とメール発報について
いつもお世話になっております。
#バージョン1.8.16
#明日4/19本番運用開始
たとえばメンテナンス時間を5:00までとします。
メンテナンス時間中はメールが飛びませんが
メンテナンス時間を過ぎると
メンテナンス時間が過ぎても障害状態のものについて
メールを飛ばす方法はありますか?
つまり、サービスについてはマシンを停止、起動を実施すると
勝手に落ちて、勝手に起動するので
そのときの情報はいらないです。
#対象が膨大ですし「障害」「復旧」メールでいっぱいになる
ところが、メンテナンス時間を過ぎても起動していないもの
についてはメールを送信してほしい、ということになります。
以上
よろしくお願いいたします。
tadashi - 投稿数: 48
追加質問ですみません。他の監視ツールで似た機能をもっているのはあるでしょうか? あったらいい機能だと思うのですが、副作用があるような気がするので、他の監視ツールで先行事例があったら知りたいです。
TNK - 投稿数: 4720
障害判定に利用するアイテムやトリガーにも依存します。
アイテムによっては、対象のサーバに障害が発生してしまっている
場合に、「値が取得できない」としか判定できず、値が取得できな
いので、トリガーも発生しない場合があります。
ですので、サーバが起動できているか、ネットワーク的に接続でき
ているかを確認するためにも、そういった状況を確認できるような
アイテムを必ず用意しておくことをお勧めします。
例えば、Zabbixエージェントを利用して監視しているサーバの起動
有無やZabbixサーバからのネットワーク到達不可を確認するために
利用できるアイテムとして「agent.ping」を利用する方法が考えら
れます。
このアイテムを利用して、長期間値が取得できなければ障害とみな
すトリガーを設定しておくことで、サーバが起動していなかったり、
間のネットワーク問題があった際、メンテナンス期間の終了後のア
イテムの値取得に失敗して、トリガーが発生します。
具体的には、2.0以降のテンプレート「Template App Zabbix Agent」
でも利用されている以下のアイテムとトリガーが参考になると思い
ます。
アイテムのキー:
agent.ping
トリガー:
{ホスト名:agent.ping.nodata(5m)}=1
Zabbix 1.8系のテンプレートにあった「status」というキーは、
2.0以降廃止されましたので、今後は利用しない方が良いでしょう。
tadashiさんのご質問の「似た機能」というのが、事前に設定した
時間帯に発報しないという意味であるならば、他のツールでも同様
な機能が存在します。
それぞれツールごとに言葉が異なったりするので、
Scheduled Downtime
Planned Downtime
計画停止
などのキーワードも利用して確認してみてください。
ご参考:
Nagios: Scheduled Downtime
http://nagios.sourceforge.net/docs/3_0/downtime.html
PandoraFMS: Planned Downtime
http://wiki.pandorafms.com/index.php?title=Pandora:Documentation_en:Mana...
PandoraFMS: 計画停止
http://pandorafms.jp/Pandora:Documentation_ja:Managing_and_Administratio...