OSリブート後、Zabbixエージェントの値が取得できなくなる

監視対象サーバのOSリブート後、Zabbixエージェントの値が取得できなくなる事象が発生しました。
・リブート前は取得できていた
 ただ、以下の事象が発生していました。
 ①エージェントをインストールしていたが、正しい設定ではない状態でサーバ上に設定を追加
 ②シンプルチェックの項目は取得できていたが、①の状態の為、エージェントの値は取得できていない
  状態(最新データで見ると「-」となっていた)
 ③後日、エージェントの設定を実施後も値を取得できない状態のまま
  →Agentの再起動を実施も状況改善せず
  →Zabbixコマンドラインで実施すると正常に値は取得できる状態
 ④設定したホストを一度削除し、再度ホストを追加した結果、エージェントの値も取得できるように
  なった

①~④を実施後、監視対象サーバのOSを再起動したところ、値が取得できない状況となりました。

確認する箇所を思い当たる箇所はないでしょうか。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

DHCPを利用されてたりしませんか?

ホストの登録をIPアドレスで行っている場合、DHCPを利用している
環境ではOSの再起動時に別のIPアドレスが付与されてしまう可能性
があります。

再度、各監視対象の設定と各監視対象のIPアドレスまたはホスト名
が一致しているかをご確認ください。

あと、各監視対象のzabbix_agentd.conf内の、

 ・Server
 ・ServerActive

の値が、ZabbixサーバのIPアドレスと一致しているかもご確認くだ
さい。

ユーザー tomi12120321 の写真

ご回答ありがとうございます。
DHCPは使用していない状況です。

zabbix_agentd.confの設定値ですが、「Server」の値はあったのですが「ServerActive」の設定は
ありませんでした。(バージョンは1.8.4です)

また、監視サーバ側のログを確認したところ、監視対象サーバに対して
・first network error, wait for 15 seconds
・another network error, wait for 15 seconds
のメッセージが1回ずつ出力されている状況でした。

上記メッセージを検索してみましたが、これが頻繁に出ているとサーバ側の負荷と考えられる記事がありました。
今回は1回ずつしか出ていないのでやはり対象サーバ個別の問題のような気がしますがいかがでしょうか。

ユーザー TNK の写真

問題は解決されたようですが、ご質問のあった部分に関して補足さ
せて頂きます。

ServeActiveは、1.8.12以降用意された設定項目です。
1.8.4にはありません。

2.0系ではタイプが「Zabbixエージェント(アクティブ)」な監視項目
を利用する場合は、設定が必須となっています。
このServerActiveに設定したZabbixサーバに対して、Zabbixエージ
ェントから送信するようになっています。

カンマ区切りで複数指定できますので、Serverの設定と合わせて
複数のZabbixサーバから監視を行えるように設定することもでき
ます。

2.0系以降を利用される場合には、ServerだけではなくServerActive
の設定も行うようにしてください。

ユーザー tomi12120321 の写真

ご連絡ありがとうございます。

2.0系は今後使用する方向で検討中です。
こちらの情報を参考に対応しようと思います。

ユーザー tomi12120321 の写真

状況が改善されましたので連絡致します。

Zabbixサーバ上のキュー状態を確認したところ、ZabbixAgentで「333」個溜まっていました。
おなじサーバ上で監視している他サーバでもZabbixAgentでの値が取得できていなかった
ようなので、サーバのプロセス再起動(正確には本番機→予備機への切替)を行ったところ、
キューもはけてZabbixAgentでの値も取得できるようになりました。

こちらはクローズでお願い致します。

ご対応いただきありがとうございました。