死活監視について

お世話になります。

ZabbixServer/Proxy2.2 MySQL5.5にてシステムを構成して監視を行って
いますが、シンプルチェックで死活監視をしているホストで誤検知が発生
します(頻度は下記対応にて現在数週間に1回程度です)

アイテムにicmpping[,3,20,30,1000]を登録して、60秒間隔にて監視して
いますが、ホストを再起動等していないにもかかわらずトリガーが発生
する場合があります。
グラフで見るとほとんど次の更新間隔(60秒後)か数分で回復しています。

ネットワークやホストを疑ってみましたが、特定のホストや時間での規則
性は見られません。

上記発生時のZabbixProxyのログに「first network error, wait for 15 seconds」
が記録されますが、毎回とは言い切れません。

ZabbixServerとProxyのTimeout値を30秒に、StartPollersを10に変更して
みましたが解決しません。
ZabbixServerの要求パフォーマンスは17程度です。

ZabbixServerと別のホストにてMySQL5.5の準同期レプリケーションを実施
していますが、MySQLログにはエラーは見られません。

今後の調査/解決のために何かご助言いただけないでしょか?
よろしくお願い致します。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

icmpping[]の引数で、1000ミリ秒(=1秒)でタイムアウトするように
設定されているようですから、ZabbixサーバとプロキシのTimeout
を30秒と伸ばしても、ICMP pingのチェックとしては、1秒でタイム
アウトが発生してしまうと思います。

icmpping[]で指定されている引数の見直しもご検討ください。