日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

ログファイル監視収集情報の閲覧について

【環境】
Zabbix 3.0.7
PostgreSQL:9.2.7

【質問】
Zabbixのログファイル監視機能により、ログ収集を実施しようとしています。
(フィルターをかけずにログを監視しておき、監視対象のログに出力されたすべてのメッセージをDBに蓄積する)

運用するにあたり、Zabbixで利用しているPosgereSQLのDBバックアップなどを行います。
バックアップしたDBに蓄積されている、ログ収集の情報を確認する方法はどのような手段がありますか?

言葉足らずかもしれませんが、不明点があれば追記いたしますのでご連絡願います。
以上よろしくお願いいたします。

Aget-Ping監視のみエラーになる現象について

いつも参考にさせていただいております。

以下の構成のZabbixにて一か月に二度、一時間ほどAgent-Ping監視のみが疎通不可となる現象が発生しております。

2台のZabbixから同じ端末の監視を行っておりますが、必ず発生するZabbixサーバーは同じで時間や対象サーバーは発生するたびに違います。
正常なZabbixサーバーではすべて疎通が取れているのと、他のエージェントを使用した監視は問題ないのでAgent側には問題がないと考えております。

構成情報

Zabbixバージョン:2.4.8
監視アイテム数:4495
トリガー数:972
パフォーマンス:6.93
StartPoller=5

エラー情報:
障害が発生するZabbix-serverにて"value cache is fully used: please increase ValueCacheSize configuration parameter"が発生しておりますが、直接的な原因なのかが不明です。
※value cacheは8M

対象の監視情報
アイテム:Agent ping
キー:agent.ping
監視間隔:120秒
トリガー:{template:agent.ping.nodata(5m)}=1

復旧していない機器の回復メッセージが送信される

いつもフォーラムを参考にさせていただいています。

当方の監視環境にて「復旧していない機器の回復メッセージが送信される」事象があり
原因が良く分からず、困っております。
どなたかご教示いただけませんでしょうか?
(環境:CentOS6.7 zabbix 2.4.6)

■現象
 数10台の機器をPing監視している環境(一部機器は停止状態)で、回線断が発生⇒回復。
 元々停止状態の機器は回線が復旧してもPingNGの状態のままなので回復メッセージが
 送信されないはずなのですが、停止中の機器の回復メッセージが送信されてしまった。
 <停止中の機器の状態>
 ・イベントに回復状態の表示あり。
 ・ヒストリーのグラフ上では該当時間中もdown(0)の表示のまま。

■トリガー
 {host1:icmpping[,,300].count(900,0)}>12

■アクション
 トリガーの値=障害
 トリガーの深刻度=重度

以上、よろしくお願い致します。

zabbixサーバにてCPU使用率が上昇する

お世話になっております。
Zabbix 2.4.8にて監視を行っております。

Zabbixサーバにて普段はCPU使用率は約10%ほどでしたが、最近突然60%以上になりその後90%以上になることがあります。
(約2カ月ほど使用していましたがそんな事象は発生しませんでした。)

psコマンドで確認した結果どうやらzabbixのプロセスで問題があるようです。
コマンド : ps auxw | grep zabbix
対象プロセス : zabbix 29347 97.5 0.1 136312 5444 ? R 17:00 157:11

zabbix_server.logやzabbix_agentd.logにもめぼしいエラーは無く、
関連性があるか不明ですがmessagesを確認した結果としては
下記のメッセージが大量に出ているといった状況でした。
 rsyslogd-2177: imuxsock begins to drop messages from pid XXXXXX due to rate-limiting

上記点に関しまして何かご教示いただければ幸いです。

Zabbix Server 復旧後のログファイル監視について

Zabbix 3.0を使用しています。

Zabbix Server⇒Zabbix Agentに対してログファイル監視をおこなっております。
Zabbix Serverが停止し、その後起動した場合、停止していた期間のログもZabbix Server起動後に収集される認識です。
Zabbix Server起動後収集するにあたり、Zabbix Serverが停止している時間が何時間以内でないと
起動後収集が行えないなど制限はありますでしょうか?

コンテンツ配信