日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

ログファイルの文字列監視(超基本)

zabbixでの監視を始めたばかりの初心者です。
このコミュニティや様々なネットの情報を頼りに設定を進めております。
プロセス数監視やWindowsサービス監視はすんなり出来たのですが、ログファイルの監視をするにあたり
まず、超基本的なログファイル監視を設定したのですが、動作せず、ファイルに文字列を書き込んでも無反応です。

気付いた点があれば教えてもらえると助かります。

行いたいこと:/tmp/test.logファイルに【error】という文字列が書き込まれたらダッシュボードにアラート表示。
環境:サーバーに、zabbix3.0とzabbixエージェントを導入しており、サーバー自身のエージェントを使ってログファイルを監視します。

設定内容
〔アイテム〕
名前:Log File Management
タイプ:zabbixエージェント(アクティブ)
キー:log[/tmp/test.log,error,,,,]
データ型:ログ

〔トリガー〕
名前:test.logログファイルに"error"
条件式:{Zabbix30-CentOS76:log[/tmp/test.log,error,,,,].str(error,#1)}=1
深刻度:重度の障害

〔/etc/zabbix/zabbix_agentd.confの設定(抜粋)〕

現状と違うバージョンのデータをDBにリストアしてしまった場合の対処

「Session terminated, re-login, please.」と表示され、管理者権限でのログインができない
http://www.zabbix.jp/node/3327

に書かれている内容と同様と思われるのですが、具体的な対応法としてどのようにするのが適切かご教授いただければと書き込んでおります。

環境 zabbix 3.4.15
DB mariadb 10.1

zabbixのDBのみ破損してしまい、回復を図ったのですがうまく修復できず、バックアップしていたデータからリストアしました。
この時バックアップしていたデータが現状のバージョンの物ではなく、古い物だったため「Session terminated, re-login, please.」と画面に表示される状態となりました。
先に示したスレッドで、バージョンを合わせれば良い、との回答があったのですが、手順としてはどのようにするのがベターでしょうか?
システム側を全体的にリストアしたDBで利用していたバージョンに戻し、そこから再度3.4.15まであげる、と言うのが適切かと思うのですが、もしDB側のバージョンのみあげられるようであれば
そちらの対処が出来ないかと思い、書き込んでおります。

データストアの読取/書込操作でステータスが「取得不可」になる件について

ESXiの監視を行うために、以下のキーの監視項目を利用しています。

vmware.hv.datastore.read[{$URL},{HOST.HOST},datastore1,latency]

その項目のステータスは「取得不可」になっており、
情報欄は「Performance counter instance was not found」になっています。

zabbix_server.logを確認したところ、
6095:20190918:144132.940 item "ホスト1:vmware.hv.datastore.write[{$URL},{HOST.HOST},datastore1,latency]" became supported
6098:20190918:144133.940 item "ホスト1:vmware.hv.datastore.write[{$URL},{HOST.HOST},datastore2,latency]" became supported

データストアの読取/書込操作で不定期にエラーが発生する件について

ESXiの監視を行うために、以下のキーの監視項目があります。

vmware.hv.datastore.read[{$URL},{HOST.HOST},datastore1,latency]

その項目の情報欄を確認すると、不定期(1時間に1~2回)の間隔にて、
「Timeout was reached」が表示されます。

zabbix_server.logを確認したところ、
6096:20190918:143132.712 item "ホスト1:vmware.hv.datastore.write[{$URL},{HOST.HOST},datastore1,latency]" became not supported: Performance counter data is not available.
6098:20190918:143133.718 item "ホスト1:vmware.hv.datastore.write[{$URL},{HOST.HOST},datastore1,latency]" became not supported: Performance counter data is not available.
が出力されていました。

しばらく(約10分ぐらい)すると、以下のログが出力され、zabbixのUI上も

ログ監視でXX回検知でアラートの方法

メールボックスの滞留をログ監視しております。

メールボックスが500以上滞留していた場合、

ログに
メールサーバ名,メールボックスNo,滞留数

が吐かれ、アラート検知します。

アラート検知した場合、下記作業が必要です。
メールサーバへのping
メールボックスのGUIでの確認

上記作業は、基本的に滞留が一時的のため無駄に終わるため、
監視の仕組みを瞬発的にではなく、継続的に滞留していた場合に
アラートを出すに変えたいです。

リソース監視などであれば、count関数などで
XX回継続して、XX超えていたらなどができると思いますが、
同じことをログ監視でもできないでしょうか?

現在はログには滞留数を500超えた場合に吐かれますが、
監視を実現するために、定期的に図れるようにすることも可能です。

よろしくお願いします。

コンテンツ配信