Zabbixエージェント(アクティブ)を利用したログ監視

Zabbix 1.4を使用しています。

監視対象のサーバ(Linux)約20台にzabbix_agentdを導入し、
各サーバごとに5ファイル程度のログ監視を設定し、
60秒周期でチェックするようにしています。

このとき、60秒周期にチェックが行われるのは、
各サーバで1〜2ファイル程度で、
それ以外のファイルは、非定期にチェックが行われます。
#60秒周期にチェックが行われるファイルは、
#サーバによって異なり、時間帯によっても変化しているようです。

zabbix_agentd.logには、
"Timeout while answering request"
と出力されています。

各サーバで全ファイルを設定した周期通りにログ監視させるために、
何をすべきでしょうか。
(まず、何を(どこを)調べる必要がありますか)

本件に関係のありそうなzabbix_agentd.confの現在の設定値は、
以下の通りです。

StartAgents=5
RefreshActiveChecks=60
Timeout=3

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。

広瀬です

> このとき、60秒周期にチェックが行われるのは、
> 各サーバで1〜2ファイル程度で、
> それ以外のファイルは、非定期にチェックが行われます。

少し疑問なのですが、この定期的、非定期に行われていると確認はどこでされたのでしょうか?
ZABBIXログ以外からでは細かな判断は出来ないと思うのですが、もしかすると最新データの
部分でしょうか?

その点ご回答お願いいたします。

ユーザー TNK2 の写真

最新データの更新時刻、およびヒストリの内容から
判断をしています。

監視対象のファイルには、チェックする周期よりも短い間隔で
ログが記録されている状態でも、最新データがいつまでも更新されない状況のため、
そう判断しています。

ユーザー kodai の写真

zabbix_agentd.logには、"Timeout while answering request"と出力されています。

エージェントがTimeoutの時間以内に、Zabbixサーバにデータを送信完了できていない可能性が高いと思います。改善策としては、

- zabbix_agentd.confのTimeoutの設定を大きくする
- Zabbixサーバのデータベースのパフォーマンスを改善する

のどちらかになると思います。

ユーザー TNK2 の写真

情報ありがとうございます。

まずタイムアウトの設定変更、
データベースのパフォーマンスチューニングの順で
対応を検討してみます。