Zabbix_agent.ping の疎通監視の誤検知について
いつもお世話になっております。
Zabbix_agent.ping の疎通監視の誤検知について問合せをさせて頂きます。
【背景】
本日、監視対象ホストのZabbix_agent.ping の疎通監視においてDownを検知しました。
Down検知の対象ホストが多かった事もあり、NWトラフィック状態とZabbixサーバ側の負荷を確認したところ
ZabbixServer側にて負荷が上昇したタイミングと合致しておりました。
上記より、ZabbixServer側の高負荷に伴う、誤検知と考えておりますが
アイテムの取得のヒストリーを確認したところ、該当時間帯のアイテムは特に遅延なく取得できておりました。
【バージョン情報】
Zabbix 1.8.16
【ご質問】
ヒストリー上に記録されているアイテム受信日時は、どのタイミングでの時間が記録されますでしょうか。
①.ZabbixAgent側の応答パケット送信タイミング
②.ZabbixServer側での応答パケット受信タイミング
③.ZabbixServer側にて応答パケットを基にDBサーバへ登録されたタイミング
感覚的には②のタイミングだと考えており、Agentからの応答パケット「1」を正常に受信したが
高負荷の為にDBサーバ側へ登録が遅延し、Timer関数側でDownを判断してしまったと考えております。
尚、Down検知後はすぐに復旧を検知しております。
もし宜しければ、上記仕様について教示のほどお願い致します。
TNK - 投稿数: 4671
agent.pingに関しては、ZabbixサーバーがZabbixエージェントにリ
クエストを投げて、その結果を受け取った時の時刻と結果の値とを
DBに保存するようにしているようです。
つまり、ご認識されている通り、②になるでしょう。
ただし、アイテムのタイプが「Zabbixエージェント(アクティブ)の
アイテムは、Zabbixエージェントでの取得時刻と合わせて値が送ら
れてくるので、Zabbixサーバーが受け取った時刻ではなく、そのエ
ージェントから受け取った時刻を保存するようになっているようで
す。
データベースの処理での遅延が発生していたり、各役割のプロセス
のbusy率が高いと、障害検知の遅延が発生しやすいので、データベ
ースのチューニングや各プロセスのbusy率の状態にも注意して運用
するようにしてください。
ポチ - 投稿数: 4
TNK様
本件ご回答頂き、誠にありがとうございます。
今回のアイテムタイプが「Zabbixエージェント(アクティブ)」となりますので
エージェントから受け取った時刻(Zabbixエージェントでの取得時刻)を受信したという認識でよろしいでしょうか。
頂きました回答内容にて疑問が解消しました。
以降は本件ナレッジを踏まえ、運用させて頂きます。
お忙しいところ、ご回答ありがとうございます。