アクションが行われない状況について
いつも参考にさせていております。
Zabbix 2.0.,4 を利用しております。
OS は、CentOS を利用しております。
ロードバランサーから syslog を Zabbix Server に送り、そのログに対してアイテムとトリガーを作成しております。
アイテム:log[/var/log/remote/lb.log,err,,]
トリガー:{Zabbix server:log[/var/log/remote/lb.log,err,,].regexp("lb[[:space:]]err")})=1
毎日、定期的に上記のトリガーが発生し、アクションにてメールを送信しております。
アイテム取得状況は、最後に記載します。
メール送信が行われない事象が発生したため、状況を確認すると以下のような状態でした。
1) アイテムは取得されていた
2) トリガーも発生していた
4) 24 行のログの内、最新の 5 行のみアクションが行われなかった
アクションが行われなかった時刻にて、以下のグラフを確認すると、100%を示していました。
・監視データ / グラフ , ホスト : Zabbix_server , グラフ : Zabbix internal process busy %
現在、ハードウェア等を確認しておりますが、他に問題等について見解が頂ければと思い、投稿致しました。
・アイテムの取得状況
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
2014/09/24 05:42:40 - Sep 24 05:42:32 lb err tmm1[11111]: 01010221:3: Pool /Common/pool-vol01 now has available members
2014/09/24 05:42:40 - Sep 24 05:42:32 lb err tmm[11111]: 01010221:3: Pool /Common/pool-vol01 now has available members
2014/09/24 05:42:40 - Sep 24 05:42:31 lb err tmm1[11111]: 01010221:3: Pool /Common/pool-vol02 now has available members
2014/09/24 05:42:40 - Sep 24 05:42:31 lb err tmm1[11111]: 01010221:3: Pool /Common/vol03-Pool now has available members
2014/09/24 05:42:40 - Sep 24 05:42:31 lb err tmm[11111]: 01010221:3: Pool /Common/pool-vol02 now has available members
2014/09/24 05:42:40 - Sep 24 05:42:31 lb err tmm[11111]: 01010221:3: Pool /Common/vol03-Pool now has available members
2014/09/24 05:01:50 - Sep 24 05:01:44 lb err tmm1[11111]: 01010028:3: No members available for pool /Common/pool-vol01
2014/09/24 05:01:50 - Sep 24 05:01:44 lb err tmm1[11111]: 01010028:3: No members available for pool /Common/vol03-Pool
2014/09/24 05:01:50 - Sep 24 05:01:44 lb err tmm[11111]: 01010028:3: No members available for pool /Common/pool-vol01
2014/09/24 05:01:50 - Sep 24 05:01:44 lb err tmm[11111]: 01010028:3: No members available for pool /Common/vol03-Pool
2014/09/24 05:01:50 - Sep 24 05:01:43 lb err tmm1[11111]: 01010028:3: No members available for pool /Common/pool-vol02
2014/09/24 05:01:50 - Sep 24 05:01:43 lb err tmm[11111]: 01010028:3: No members available for pool /Common/pool-vol02
2014/09/24 04:32:10 - Sep 24 04:32:04 lb err tmm1[11111]: 01010221:3: Pool /Common/pool-vol04 now has available members
2014/09/24 04:32:10 - Sep 24 04:32:04 lb err tmm[11111]: 01010221:3: Pool /Common/pool-vol04 now has available members
2014/09/24 04:32:10 - Sep 24 04:32:01 lb err tmm[11111]: 01010221:3: Pool /Common/pool-vol05 now has available members
2014/09/24 04:32:10 - Sep 24 04:32:01 lb err tmm[11111]: 01010221:3: Pool /Common/vol06-Pool now has available members
2014/09/24 04:32:10 - Sep 24 04:32:01 lb err tmm1[11111]: 01010221:3: Pool /Common/pool-vol05 now has available members
2014/09/24 04:32:10 - Sep 24 04:32:01 lb err tmm1[11111]: 01010221:3: Pool /Common/vol06-Pool now has available members
2014/09/24 04:01:50 - Sep 24 04:01:46 lb err tmm[11111]: 01010028:3: No members available for pool /Common/pool-vol05
2014/09/24 04:01:50 - Sep 24 04:01:46 lb err tmm1[11111]: 01010028:3: No members available for pool /Common/pool-vol05
2014/09/24 04:01:50 - Sep 24 04:01:46 lb err tmm1[11111]: 01010028:3: No members available for pool /Common/vol06-Pool
2014/09/24 04:01:50 - Sep 24 04:01:46 lb err tmm[11111]: 01010028:3: No members available for pool /Common/vol06-Pool
2014/09/24 04:01:50 - Sep 24 04:01:45 lb err tmm1[11111]: 01010028:3: No members available for pool /Common/pool-vol04
2014/09/24 04:01:50 - Sep 24 04:01:45 lb err tmm[11111]: 01010028:3: No members available for pool /Common/pool-vol04
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
TNK - 投稿数: 4769
Zabbixサーバのログもご確認ください。
Zabbixサーバを稼働させているサーバの負荷が非常に高い場合、ト
リガーが発生した際、アクションを実行するためにデータベース上
に実行するアクションの内容を登録するのですが、その時にデータ
ベースの処理でタイムアウトが発生して登録できず、アクションが
実行されない場合があったかと思います。
そのような状況が発生した場合には、Zabbixサーバのログにエラー
メッセージが出力されます。
koji.bz - 投稿数: 20
TNK 様
返信頂き、ありがとうございます。
データベース処理時のタイムアウトと言う事で、確認してみます。
通常時はそれほど負荷がないと認識しているのですが、他にも要因があるかもしれませんので、「負荷」という観点で、ハードウェアレベルも確認してみます。
次回の発生時が不明ですが、Zabbix Sever 側のログも確認してみます。