死活監視について
お世話になります。
ZabbixServer/Proxy2.2 MySQL5.5にてシステムを構成して監視を行って
いますが、シンプルチェックで死活監視をしているホストで誤検知が発生
します(頻度は下記対応にて現在数週間に1回程度です)
アイテムにicmpping[,3,20,30,1000]を登録して、60秒間隔にて監視して
いますが、ホストを再起動等していないにもかかわらずトリガーが発生
する場合があります。
グラフで見るとほとんど次の更新間隔(60秒後)か数分で回復しています。
ネットワークやホストを疑ってみましたが、特定のホストや時間での規則
性は見られません。
上記発生時のZabbixProxyのログに「first network error, wait for 15 seconds」
が記録されますが、毎回とは言い切れません。
ZabbixServerとProxyのTimeout値を30秒に、StartPollersを10に変更して
みましたが解決しません。
ZabbixServerの要求パフォーマンスは17程度です。
ZabbixServerと別のホストにてMySQL5.5の準同期レプリケーションを実施
していますが、MySQLログにはエラーは見られません。
今後の調査/解決のために何かご助言いただけないでしょか?
よろしくお願い致します。
TNK - 投稿数: 4769
icmpping[]の引数で、1000ミリ秒(=1秒)でタイムアウトするように
設定されているようですから、ZabbixサーバとプロキシのTimeout
を30秒と伸ばしても、ICMP pingのチェックとしては、1秒でタイム
アウトが発生してしまうと思います。
icmpping[]で指定されている引数の見直しもご検討ください。