Zabbixエージェントサーバ再起動後の不具合について
お世話になっております。
現在、以下の環境下でZabbixによる監視を行っております。
<マネージャ>
OS・・・RedHatEnterpriseLinux5.3
Zabbixマネージャ・・・version1.8.2(ZABBIX-JP版)
<エージェント>
(ZABBIX-JP版)
OS・・・Windows Server 2003 SP2
Zabbixエージェント・・・version1.8.2(ZABBIX-JP版)
監視内容・・・
・プロセス数監視
・ログファイル監視
・Windowsイベントログ監視
この度はZabbixエージェントサーバ再起動後に、下記の不具合が発生したため、投稿させていただきました。
<不具合内容?>
Zabbixエージェントを自動起動設定にした状態で、エージェントサーバを再起動しました。
するとOS起動後、上記の監視内容の内、プロセス監視、Windowsイベントログ監視は正常に監視が始まりました。
しかし、ログファイル監視については監視が正常に開始せず、ログファイルにメッセージが出力されても、それを検知することができませんでした。
<不具合内容?>
エージェントサーバの再起動後、約一週間が経った後、特に何もZabbixマネージャやエージェント側を操作することなく、突然ログファイルの監視が始まりました。
そこで質問させていただきたいのですが、上記のような不具合が起きた原因について、何かお分かりになられますでしょうか?
足りない情報等があれば、追加いたします。
以上、よろしくお願いいたします。
kodai - 投稿数: 1341
Zabbixエージェントはzabbix_agentd.confのMaxLinexPerSecond、もしくはlog[]キーのオプションのmaxlinesに設定されている行数×監視間隔以上の行数がある場合はログを送付しないようになっています。(実際には内部で他にも処理が入っているので厳密には違いますが)
アイテムを設定した時点ではログの行数が上記の制限値を上回っていて、ログローテーションが行われたタイミングでログが取得され始めた、ということはないでしょうか?
sepata_kurou - 投稿数: 22
kodaiさん
ご回答ありがとうございます。
今回の場合ですと、maxlinesに設定されている行数×監視間隔=100行×60秒=6000です。
さすがに、これはないです・・・・。
また、ログローテーションの監視も、今回は行っていません。
そこで、もうひとつご質問があるのですが・・・・。
Zabbixでログ監視中、ログファイルに関連するサービスが再起動したことにより、ログが一度クリアされてしまいました。この時、ログ監視の状態が「取得不可」となってしまった可能性があります。このように監視対象ログファイルがクリアされると監視の状態が「取得不可」になるというのは、Zabbixの仕様なのでしょうか?
以上、よろしくお願いいたします。
kodai - 投稿数: 1341
ログファイルがいちどクリア(空ファイル)になると、最初の行から読み直す処理が入るだけで、「取得不可」の状態になるということはないはずなのですが。。。
ファイル自体が一時的に存在しなくなった場合は「取得不可」の状態になってしまう可能性があります。