MAP上のホストの不明の原因調査方法

お疲れ様です。

ZABBIX1.8.3を使用しておりますが、しばしばホスト上でアイテムが全て有効(取得不可になっていない)でホストに紐づくトリガーも緑のチェックマーク(エラーとなっていない)にもかかわるマップ上で「正常」とならずに「N不明」(Nは個数)とでる場合があります。この不明の内容を知る方法は無いのでしょうか?

現在私がとっている方法は全てのトリガーを一度無効にしております。こうするとマップ上で正常にかわりますので一つづつ有効/無効の切替を行って不明の元をさぐるようにしております。
大変非効率なやり方ですが。。

マップ上で不明となる原因元を調査する良い方法がありましたら
ご指導お願い致します。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー kodai の写真

もしトリガー自体に(表面的に)問題がないにも関わらずマップ表示に問題が出るとしたら、根本的にZabbixのバグかもしれないですね。

現在私がとっている方法は全てのトリガーを一度無効にしております。こうするとマップ上で正常にかわりますので一つづつ有効/無効の切替を行って不明の元をさぐるようにしております。

原因になっているトリガーに共通することや、問題が発生する条件などがお分かりでしたら教えていただけると調査できると思います。何か原因の調査の糸口になることでも構いません。

ユーザー VTR1000F の写真

ご返事ありがとうございます。

発生条件は現状、わかりません。意図的に発生させることが
出来ない状態です。
「トリガー」を有効にするとマップで不明となるホストは、
アイテムの項目では取得不可にはなっておらず有効となっています。また、このテンプレートは他に複数のサーバにも採用しておりますが他のサーバでは不明にはなりません。

現状で不明となるものははあまり重要でないトリガーですので
無効にして対応することに致します。

ご回答ありがとうございました。

ユーザー VAXVMS の写真

VTR1000Fさん、

こんにちは。
私も、同様の経験があります。
私の場合は、ログ監視(error文字列の監視)とZabbix Trapperを使用しているアイテムのトリガーが原因でした。
この2つのアイテムはZabbix Serverから能動的に監視するというより、受動的に監視データを受信するアイテムです。
ここからは経験上の推論なんですが、このようなアイテムは1回目のトリガーが発生するまで状態は『不明』になっているようです。

私の解決策は、ログ監視に関しては強制的にerrorの文字列をechoコマンドで書き込み、Zabbix Trapperに関してはzabbix_senderで強制的にトリガーをリセット(トリガー条件が >0 なので 0を送ってリセット)しています。ログ監視はとりあえず nodata(xxx)で指定した時間内に再度errorの文字列を検出しなければ『正常』に戻るようにしています。

ご参考までに、1.8.1までは無効にしたアイテムに対応するトリガーが有効になっているとマップ上で『不明』を表示していましたが、1.8.3ではそれは出ない筈なのでこれは本件とは関係ないと思いますが...

ご参考になれば幸いです。
vaxvms

ユーザー VTR1000F の写真

VAXVMSさん、こんにちは。

確かにログファイルは登録してから更新されないと値がとれずに
不明になりますね。

ただ、今回の不明になるものは取得不可にならず値がとれている
アイテムのトリガー達のいくつかがトリガー有効にすると
不明となってしまうのです。

無効にしても差し障りないトリガーですので暫定的に無効で
対処しています。