ダッシュボードの最新20件の障害表示について
お世話になります。表題の件についてご質問させてください。
ZABBIX Ver 2.4 にて数十台のホストの監視をしております。
クラウド事業者の障害が原因となり、MYSQLのテーブル情報が壊れてしまいました。
このタイミングで全ての監視ホストとの疎通がとれなくなりました。
早々にテーブルをリペアしまして、GUIでMYSQLのエラー表示は無くなったのですが、
これが原因でアラートとなったトリガーが復旧せず(値としては復旧値になっていますが、アラートのステータスは障害のまま)、
ダッシュボードの最新20件の障害表示に残ったままとなっております。
監視ホストは正常稼働しておりますが、障害表示だけ残っているので、これを消す手順はありますか?
よろしくお願いします。
TNK - 投稿数: 4769
障害として残ってしまっている項目に関して、どのようなアイテム
やトリガーの設定をされているのかをお教えください。
それぞれのアイテムの値は取得できていますか?
取得不可の状態になっていたり、何らかのエラーが発生していない
か、ログファイルやWebインターフェース上の表示を確認してくだ
さい。
データベースを直接変更して対応できるものもあるかもしれません
が、あまりお勧めしません。
また、ご提供いただいた情報だけでは、何が壊れてしまったのかも
わかりませんし、設定内容や状況をこのフォーラムだけで把握して
問題解決することが難しいことが予想されますので、Zabbixのサポ
ートをしているベンダーとのサポート契約を行うこともご検討くだ
さい。
ただし、Zabbix 2.4系はサポートが終了してしまっているので、現
時点のバージョンそのままではサポートは受けられないかもしれま
せん。ご注意ください。
myammyam - 投稿数: 10
ありがとう御座います。
トリガーとしては、 agent.ping.nodata(300)}=1 として死活監視用のトリガーです。
アイテムの値は正常に取得できており、値としては正常値(1)なのですが、アラートのステータスは障害のままとなっているため、
ダッシュボード内にある、最新の20件の障害項目に出続けている状況です。
各ホストでヒストリを削除することでも解決出来ますでしょうか。
TNK - 投稿数: 4769
それでは対応できません。
安全な方法としては、一度あえて障害の状態にしてから、再度復旧
させれば状態は変化すると思います。
強制的に状態を変更するには、データベースを直接更新するしかな
いでしょう。
以下の内容は保障しません。
この手順を実施して発生した問題に関しては、一切責任は取れませ
ん。
事前にバックアップを取得してから作業を行ってください。
1.triggersテーブルからvalueの値が1(=障害)となっているものを検索
2.そのトリガーのvalueの値を0に更新
ex.
mysql> select triggerid,description,value from triggers where value=1;
mysql> update triggers set value=0 where triggerid=<検索された結果のtriggerid>;
myammyam - 投稿数: 10
なるほど、ありがとう御座います。
今確認したところ、
トリガーのステータスが不明となっており、情報の項目内に下記のエラーメッセージが表示されておりました。
item does not have enough data after server start or item.
myammyam - 投稿数: 10
>安全な方法としては、一度あえて障害の状態にしてから、再度復旧
>させれば状態は変化すると思います。
上記の方法にて復旧させることが出来ました。
ありがとう御座いました。
大変助かりました。