いつも参考にさせていただいております。
【環境】
監視サーバ:
Ubuntu 14.04.2 LTS
zabbix 2.2
監視対象:
windows 2008 R2 ×8台
【背景の説明】
windowsサーバのスケールイン・スケールアウトを自動で行う環境を構築しており、
スケールイン・アウト時に、対象サーバのzabbix監視(ホストの設定)を自動で無効化する用に、
zabbix APIを投げるプログラムを作成しました。
スケールイン手順概要
1) Windowsサーバのサービス切り離し
2) Windowsサーバのホストのステータスを'有効'→'無効'に変更(zabbix API)
3) Tomcat7サービスの停止および、停止確認
4) Windowsサーバの停止
※スケールアウトは上記逆順。
上記を動かしたところ、2)zabbixのホスト設定無効化し、
zabbixサーバ上でもホスト監視無効化しているにも関わらず、
3) Tomcat7サービスの停止をした際に、tomcat7の死活監視が検知しました。
<通知サンプル>
NOTE: Escalation cancelled: host 'Windows_test01' disabled.
Trigger: Apache Tomcat (Tomcat7) Windowsサービスが停止しています。
Trigger status: PROBLEM
・『NOTE: Escalation cancelled:』のメッセージが出ている為、ホスト無効の後のタイミングで、
windowsサーバのzabbix-agentがtomcat7停止を検知し、zabbix-serverに送信したものと推測しています。
zabbix-serverではホスト無効となっている為、メッセージ付きで通知が出たと考えております。
https://www.zabbix.com/documentation/2.2/jp/manual/web_interface/fronten...
【質問内容】
・スケールイン・スケールアウトを実装する際に、zabbixのホスト監視on/offに関するベストプラクティスが有れば、
教えていただきたいです。
⇒上記の事象だけで捉えると、ホストの無効処理の前に、agent側のサービス停止も必要のように思えます。
他社事例などの知見がお聞きしたいです。
・『NOTE: Escalation cancelled:』のメッセージが付いたメール送信を行わない設定は出来ますでしょうか?
⇒マニュアルやフォーラムを見たところ、上記を止めるにはDBにてstatus変更が必要とのことでした。
UI上から設定変更はできませんでしょうか?
(現在は、通知受け取り側で除外設定を行っています)