ログ監視のレコード重複と遅延について

お世話になります。

ZABBIX1.6.6でログ監視をするためアイテムを作成したところ、
一部サーバのキーワード監視が行えません。

[アイテム]
 タイプ: ZABBIXエージェント(アクティブ)
 キー: log[/var/log/messages,(キーワード)]
 データ型: ログ
 更新間隔(秒): 300
 ログ時間の形式: 空白
 アプリケーション: Log files

[状況]
・最新のデータのヒストリ(最新500個の値)で表示がない
・PostgreSQLの対象アイテムフィールドに下記MSGあり
 "last message repeated 2 times"
・更新間隔どおりキーワード監視可能なサーバあり

[サーバ監視条件]
<監視キーワード設定数>
  ・取得可能なサーバのキーワード総数:10(対象ファイル5) *10台
  ・取得不可なサーバのキーワード総数:50(対象ファイル2) *25台

[確認済事項]
・アイテムエラー欄に"Not supported by ZABBIX agent"などのMSGはございません
 (ステータスは有効です)
・/var/log/messagesのパーミッションは問題なし
・zabbix_agentd.confのDisableActive=1はコメントアウト確認
・アイテム zabbix[queue]にて1200を指していたため、その他アイテム、トリガを無効 → 改善なし
・サーバMEM,CPU負荷などはございません
・エージェント設定とZABBIXインターフェースのホスト名の差異なし

[その他]
 ZABBIXエージェントでのTimeout、RefreshActiveCheck、StartAgentsが
 デフォルト値のため調整予定

 全サーバのSNMP、プロセス、ポート、性能、資源情報は問題なく監視できております。

上記についてお手数ですがご教授頂ければ幸いです。
宜しくお願い致します。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー kodai の写真

こんにちは。

念のための確認ですが、監視が出来ているサーバと監視ができていないサーバではログ監視のアイテムのキーワードは同じ文字列を設定されていると思って良いでしょうか?

・PostgreSQLの対象アイテムフィールドに下記MSGあり
 "last message repeated 2 times"

上記はどこに出力されているのかが分からなかったのですが、メッセージの内容はsyslogに同じメッセージが連続で出力された場合の表示なので、特にエラーではないように思います。

・アイテム zabbix[queue]にて1200を指していたため、その他アイテム、トリガを無効 → 改善なし

1200はちょっと多いような気もしますが、来週にでも本番環境で動作しているzabbix[queue]の結果を見てみようと思います。念のため、Webインターフェースの[管理]->[キュー]画面で遅延が発生しているアイテムはないでしょうか。

ユーザー ryota の写真

ご返信ありがとうございます。

> 念のための確認ですが、監視が出来ているサーバと監視ができていないサーバではログ監視のアイテムのキーワードは同じ文字列を設定されていると思って良いでしょうか?

 異なる対象ファイルとキーワードになります。
 ログ監視アイテム設定は、"log[対象ファイル,キーワード]"をベースに設定しております。
 (キーワードは一番長いもので半角英数字30文字程度です)
 監視は"/var/log/messages"などへ行っており、zabbixユーザーからの読み込みが可能であることを
 確認済みです。

> 上記はどこに出力されているのかが分からなかったのですが、メッセージの内容はsyslogに同じメッセージが連続で出力された場合の表示なので、特にエラーではないように思います。

 確認が至らず申し訳ありません。上記について了解いたしました。

> Webインターフェースの[管理]->[キュー]画面で遅延が発生しているアイテムはないでしょうか。

 取得不可状態のキーワード、サーバ2台についてキューが22個ございました。対象は、サービス、リソース監視のアイテムのみだったため無効にしています。現在キューは"0"ですが改善はないようです。

 下記、パラメータをエージェント側で変更しても改善はないようです。
 Timeout
 RefreshActiveCheck
 StartAgents

 zabbix_agentd.log
 "Can't Open JASON Object"の記述がございました。

本番環境では如何でしたでしょうか。

上記、何卒宜しくお願いします。

-----------------------------
追記

参考までですが、ログ取得できないサーバーの共通点として、
"/var/log/対象ファイル" のmsgが、アプリケーションの都合により5秒ごとに更新されています。

-----------------------------
追記 2/2

上記、アプリケーションの制御を行いログを減少させましたが改善はありませんでした。