シンプルチェックで、特定時間のみ、エラーとなる。
お世話になります。
以下の環境で、シンプルチェック net.tcp.service[tcp,,80]、net.tcp.service[tcp,,3306]にて
で、特定サーバとかつ同じ時間で、エラー(Down (0))となります。
監視するサーバーのアプリには、エラーは発生していなく、正常です。
そのエラーの直後に、TCP:80、3306を確認してもエラーはなく、瞬断とみています。
ただし、Agent監視では、データは取得できていますがの近似した時間に failed: first network error, wait for 15
seconds のエラーが出ていました。シンプルチェックをしている時間ではエラーは出ていません。
ネットワークインフラの問題か、ZABBIXサーバーの問題かを調査しています。
特定サーバーと同一時間からネットワークインフラの問題の可能性もありますが、ZABBIXサーバー側で調査する箇所を
ご教授ください。
※この時間に、ZABBIXサーバーに負荷を掛けるバックアップやアプリは動作はしていないことは確認しています。
監視サーバー:
Zabbix 2.2.6
CentOS release 6.5
監視対象サーバー:
Redhat el7
Zabbix agent 2.2.9 el7
設定キーやトリガーは以下です。
キー:net.tcp.service[tcp,,3306]
トリガー:{slip-server:net.tcp.service[tcp,,3306].last()}=0
キー:net.tcp.service[tcp,,80]
トリガー:{slip-server:net.tcp.service[tcp,,80].last()}=0
よろしくお願いします。
TNK - 投稿数: 4769
Zabbixサーバー側で確認するならば、Zabbixサーバーのログや、
OSのシステムログなどに何らかの出力がされていないかを確認
してみてください。
k2k - 投稿数: 47
初歩的質問ですいません。OSやZABBIXのログを確認してみます。