2台のzabbixサーバのメッセージ検知件数に差分発生する
下記事象が発生しており原因がわからず大変困っております。
似たような事象を経験された方がいればご教示の程、宜しくお願い致します
業務でZabbixサーバ2台(1号機、2号機)を構築しました。
Zabbixサーバ2台で同じ設定、同じ監視設定をしているにも関わらず
1号機ではメッセージ検知するが2号機では検知しない時間(その逆も然り)が
発生するという事象が発生しています。
テンプレートの定義を比較しても差分は無かったため他に調査をするとなると
Zabbixサーバ2台で該当の時間にCPU高騰していないか、Zabbixサーバ自体が起動していたかを
確認する(syslog確認)しかないでしょうか。他に確認する観点がありましたらご教示いただきたいです。
Zabbixサーバ2台(1号機、2号機)の詳細は以下になります。
■Zabbixサーバ2台(1号機、2号機)の詳細
・OS:RHEL8
・Zabbixバージョン:6.0.12(Zabbix ServerとZabbix Agentをインストールしています)
・PP:apache,PostgreSQL,Tomcat,php-fpm,zabbix-server,zabbix-agent
以上、ご協力のほどよろしくお願いいたします。
TNK - 投稿数: 4760
Zabbixサーバーごとにアイテムの値を取得するタイミングは異なり
ますので、アイテムの設定やトリガーによっては、タイミングの違
いによって障害として検知するタイミング、回復のタイミングが異
なることで、障害の件数やタイミングが異なる場合があります。
最新データでアイテムの値を取得したタイミングと設定されている
トリガーや発生したイベントなどを見比べてみてください。
たぬきち - 投稿数: 4
いろいろ調査をしたところ、ログ監視でログの再読み込みが発生している可能性がありました。
監視対象のZabbix Agent2のagent2.logに以下のようなメッセージが出力されていました。
------------------------------------------------------------------------------------------------------------------------------
the modification time of log file xxx has been updated without
changing its size, try checking again later
after changing modification time the size of log file xxx still
has not been updated, consider it to be a new file
------------------------------------------------------------------------------------------------------------------------------
上記メッセージ1つ目は、1回目のチェックでファイルサイズに変更がなく、mtimeのみが更新されたログファイルを検知した場合、
zabbix_agent2.logに以下のメッセージを出力します。
上記メッセージ2つ目は、2回目のチェックでファイルサイズに変更がなく、mtimeのみが更新されたログファイルを検知した場合、
zabbix_agentd.logに以下のメッセージを出力し、別ファイルとして先頭からログファイルを読み込みます。
事象解決方法として、ログ監視のアイテムキーでmtime-norereadを指定すればログの再読み込みを
回避することが可能か、ご教示いただけますでしょうか。