Zabbix_agent.ping の疎通監視の誤検知について

いつもお世話になっております。

Zabbix_agent.ping の疎通監視の誤検知について問合せをさせて頂きます。

【背景】
 本日、監視対象ホストのZabbix_agent.ping の疎通監視においてDownを検知しました。
 Down検知の対象ホストが多かった事もあり、NWトラフィック状態とZabbixサーバ側の負荷を確認したところ
 ZabbixServer側にて負荷が上昇したタイミングと合致しておりました。

 上記より、ZabbixServer側の高負荷に伴う、誤検知と考えておりますが
 アイテムの取得のヒストリーを確認したところ、該当時間帯のアイテムは特に遅延なく取得できておりました。

【バージョン情報】
 Zabbix 1.8.16

【ご質問】
 ヒストリー上に記録されているアイテム受信日時は、どのタイミングでの時間が記録されますでしょうか。

 ①.ZabbixAgent側の応答パケット送信タイミング
 ②.ZabbixServer側での応答パケット受信タイミング
 ③.ZabbixServer側にて応答パケットを基にDBサーバへ登録されたタイミング

感覚的には②のタイミングだと考えており、Agentからの応答パケット「1」を正常に受信したが
高負荷の為にDBサーバ側へ登録が遅延し、Timer関数側でDownを判断してしまったと考えております。

尚、Down検知後はすぐに復旧を検知しております。

もし宜しければ、上記仕様について教示のほどお願い致します。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

agent.pingに関しては、ZabbixサーバーがZabbixエージェントにリ
クエストを投げて、その結果を受け取った時の時刻と結果の値とを
DBに保存するようにしているようです。

つまり、ご認識されている通り、②になるでしょう。

ただし、アイテムのタイプが「Zabbixエージェント(アクティブ)の
アイテムは、Zabbixエージェントでの取得時刻と合わせて値が送ら
れてくるので、Zabbixサーバーが受け取った時刻ではなく、そのエ
ージェントから受け取った時刻を保存するようになっているようで
す。

データベースの処理での遅延が発生していたり、各役割のプロセス
のbusy率が高いと、障害検知の遅延が発生しやすいので、データベ
ースのチューニングや各プロセスのbusy率の状態にも注意して運用
するようにしてください。

ユーザー ポチ の写真

TNK様

本件ご回答頂き、誠にありがとうございます。

今回のアイテムタイプが「Zabbixエージェント(アクティブ)」となりますので
エージェントから受け取った時刻(Zabbixエージェントでの取得時刻)を受信したという認識でよろしいでしょうか。

頂きました回答内容にて疑問が解消しました。
以降は本件ナレッジを踏まえ、運用させて頂きます。

お忙しいところ、ご回答ありがとうございます。