OSリブート後、Zabbixエージェントの値が取得できなくなる
監視対象サーバのOSリブート後、Zabbixエージェントの値が取得できなくなる事象が発生しました。
・リブート前は取得できていた
ただ、以下の事象が発生していました。
①エージェントをインストールしていたが、正しい設定ではない状態でサーバ上に設定を追加
②シンプルチェックの項目は取得できていたが、①の状態の為、エージェントの値は取得できていない
状態(最新データで見ると「-」となっていた)
③後日、エージェントの設定を実施後も値を取得できない状態のまま
→Agentの再起動を実施も状況改善せず
→Zabbixコマンドラインで実施すると正常に値は取得できる状態
④設定したホストを一度削除し、再度ホストを追加した結果、エージェントの値も取得できるように
なった
①~④を実施後、監視対象サーバのOSを再起動したところ、値が取得できない状況となりました。
確認する箇所を思い当たる箇所はないでしょうか。
TNK - 投稿数: 4769
DHCPを利用されてたりしませんか?
ホストの登録をIPアドレスで行っている場合、DHCPを利用している
環境ではOSの再起動時に別のIPアドレスが付与されてしまう可能性
があります。
再度、各監視対象の設定と各監視対象のIPアドレスまたはホスト名
が一致しているかをご確認ください。
あと、各監視対象のzabbix_agentd.conf内の、
・Server
・ServerActive
の値が、ZabbixサーバのIPアドレスと一致しているかもご確認くだ
さい。
tomi12120321 - 投稿数: 113
ご回答ありがとうございます。
DHCPは使用していない状況です。
zabbix_agentd.confの設定値ですが、「Server」の値はあったのですが「ServerActive」の設定は
ありませんでした。(バージョンは1.8.4です)
また、監視サーバ側のログを確認したところ、監視対象サーバに対して
・first network error, wait for 15 seconds
・another network error, wait for 15 seconds
のメッセージが1回ずつ出力されている状況でした。
上記メッセージを検索してみましたが、これが頻繁に出ているとサーバ側の負荷と考えられる記事がありました。
今回は1回ずつしか出ていないのでやはり対象サーバ個別の問題のような気がしますがいかがでしょうか。
TNK - 投稿数: 4769
問題は解決されたようですが、ご質問のあった部分に関して補足さ
せて頂きます。
ServeActiveは、1.8.12以降用意された設定項目です。
1.8.4にはありません。
2.0系ではタイプが「Zabbixエージェント(アクティブ)」な監視項目
を利用する場合は、設定が必須となっています。
このServerActiveに設定したZabbixサーバに対して、Zabbixエージ
ェントから送信するようになっています。
カンマ区切りで複数指定できますので、Serverの設定と合わせて
複数のZabbixサーバから監視を行えるように設定することもでき
ます。
2.0系以降を利用される場合には、ServerだけではなくServerActive
の設定も行うようにしてください。
tomi12120321 - 投稿数: 113
ご連絡ありがとうございます。
2.0系は今後使用する方向で検討中です。
こちらの情報を参考に対応しようと思います。
tomi12120321 - 投稿数: 113
状況が改善されましたので連絡致します。
Zabbixサーバ上のキュー状態を確認したところ、ZabbixAgentで「333」個溜まっていました。
おなじサーバ上で監視している他サーバでもZabbixAgentでの値が取得できていなかった
ようなので、サーバのプロセス再起動(正確には本番機→予備機への切替)を行ったところ、
キューもはけてZabbixAgentでの値も取得できるようになりました。
こちらはクローズでお願い致します。
ご対応いただきありがとうございました。