日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

ログ監視のアイテムの時間と比較するトリガー

お世話様です。

ログ監視にて、アイテム設定で時間に絞ったログを取得しています。

アイテム
キー
logrt["ログのパス","時間=",932]

取得できる値
時間=00:00:00

アイテムの「保存前処理」で「時間=」は削除しています。

ヒストリに保存される値
00:00:00

更新時間
1分

zabbix server ver 3.4
agent ver 2.4.4

取得したヒストリの時間とzabbix serverの時間が10分以上差があれば
障害を検知するトリガーを作成したいのですが、トリガーの設定はどのように
設定したらよいかご教示いただくことは可能でしょうか。

アイテムで「ログの時間の形式」の時間を取得する方法も考えたのですが、
恐らくログの先頭から日付が入っているもの意外は取得が難しい仕様だったので、
この方法は断念しました。

以上良い方法ご存知の方いましたら、宜しくお願い致します。

vfs.file.regexpは計算アイテムで使用できる?

いつもお世話になっております。
掲題の件について質問いたします。

使用環境
Zabbix Server:3.2.11
OS:CentOS 7.4
Zabbix Agent:3.2.11
OS:CentOS:7.4

性能情報収集のため、vfs.file.regexpを使用してログファイルから値を取得するアイテムを作成しました。
このアイテムを使用して別に計算用アイテムを作成しましたが、エラーとなり計算ができません。
計算元アイテムと計算用アイテムは同じホストに設定しています。

作成したアイテムの式
17262-last("vfs.file.regexp[/xxxx/xxxx.txt,"([0-9].*) MiB",,,,\1]")

エラー内容
Cannot evaluate expression: expected numeric token at "last("vfs.file.regexp[/xxxx/xxxx.txt,"([0-9].*) MiB",,,,\1]")".

試しにCPUのidleを取得するアイテムを使用して計算してみましたが、こちらが問題なく計算できています。

試したアイテムの式
17262-last("system.cpu.util[,idle,avg1]")

zabbix_server.serviceのvmware.collectorの1プロセスに負荷が集中する

VM LLD監視をしていますが、vmware.collectorの1プロセスに負荷が集中します。
それが原因となり、systemctlでrestart/stopを実行時に、負荷のかかっているvmware.collectorが
正常終了せずプロセスに残存してしまいます。
※残存プロセスをkillしないと、zabbix_server.serviceが起動しなくなる

StartVMwareCollectors=20などで設定しても、コア別の使用率では1コアだけが100%を専有、
あとの15プロセスほどは使用率0%で動いていません。
※負荷分散が仕様上、1コアに集中してしまう? その場合の回避方法はvCenterサーバで管理する台数を分ける必要などがある?

もし本当に仕様ならば、同様の現象にあっているひとがいそうですが。。。

また、おそらくは高負荷が原因となり、頻繁にアイテムの取得が「became not supported」になります。
ログに「became not supported」「became supported」が溢れて難儀しています。

しかも、時折zabbix_server.serviceがダウンします。
ダウンすると、vmware.collectorが残存し、本体のプロセスが正常に起動してこなくなるコンボで困っています。

zabbix-serverサービス停止

AWSにてZabbixサーバを構築し監視を行っているのですが、ここ数日前から突然zabbix-serverのサービスが停止し、監視できていない状況が多発するようになりました。
zabbix_server.logには停止時のログは下記の通りです。
*********************************************************************
syncing history data done
syncing trends data...
syncing trends data done
Zabbix Server stopped. Zabbix 2.4.8 (revision 59539).
*********************************************************************

調査を進めておりますが原因を全くつかめず(ログには残っていない。)原因かどうか不明ですが、唯一見つけた情報が下記のエラーとなります。
*********************************************************************

別のログの内容を収集してしまう原因について

いつもお世話になっております。
掲題の件について質問させてください。

使用環境
Zabbix server:3.0.7
OS:CentOS 7.3
Zabbix agent:3.0.7
OS:CentOS 7.3

以下の2つのログを収集アイテムをそれぞれ1つずつ作成しました。
※格納されているディレクトリは同じです。

対象ログ1
/xx/xx/access.log
対象ログ2
/xx/xx/xxxx.xxxx.xxxx_access.log

アイテム1
logrt["/xx/xx/(access.log|access.log-[0-9]{8})"]
アイテム2
logrt["/xx/xx/(xxxx.xxxx.xxxx_access.log|xxxx.xxxx.xxxx_access.log-[0-9]{8})"]

現象
対象ログ1にログが出力されると、アイテム1のみで収集する(正しい動作)。
対象ログ2にログが出力されると、アイテム1とアイテム2の両方で収集されてしまう。
対象ログ1にログが出力されアイテム1で収集後に対象ログ2が出力されると、アイテム1では対象ログ1の差分と対象ログ2を頭から収集する。

両ログ名に「access.log」が含まれてはいますが、指定しているファイル名は異なります。

コンテンツ配信