日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

複数テキストログの監視を特定時間で実施し、メール通知する方法

いつも参考にさせて頂いています。

表題の件について、下記を実現したいと思っています。
Zabbixは2.4です。
①夜中に複数バッチが走り、朝までに複数のテキストログが出力される。
②①のログは同時刻に生成される場合もある。
③AM6:00にテキストログをチェックし、Errorの文字列が存在する場合にメール通知する。

Zabbixの設定として、トリガーにはテキストログ2という名前で以下のように設定しています。
({HOST:logrt["C:\temp\.*.log$",Error].logsource(Error)}=0)and({HOST:logrt["C:\temp\.*.log$",Error].nodata(30)}=0)

メール通知は以下のように設定しています。
アクションの実行条件 ⇒  トリガー = HOST: テキストログ監視2
アクションの実行内容 ⇒ ユーザーにメッセージを送信: mail (mail) via Email すぐに 標準

③のように特定時間にそれまで溜まっているテキストログを一気にチェック(同時刻に生成されたログも含む)し、
Errorの文字列が存在する場合にメール通知する、ことは可能でしょうか。

大量アラートの一部削除の方法につきまして

アラート送信キューに大量にメールが溜まってしまった場合
以下で全除する方法を知りました。
この方法は、全メールが削除されてしまいます。
UPDATE alerts SET status = "1" where status = "0";

SQLを工夫することで、一部のメール(alert id)だけ
status = "1"に変更するようにしたら
アラート送信キューの一部だけを削除することが
可能でしょうか?
一部の削除だけをおこなって、zabbix本体の動作に
支障はないのでしょうか?
よろしくお願い致します。

zabbix 2.4.7

多数の監視をもつzabbixを起動する場合について

いつもお世話になっております。
下記につきまして、ご教授いただきたく、よろしくお願い申し上げます。

------------------------------------------------------------------
【環境】
・本番機
 zabbix2.4.7
 登録ホスト数約1500
 登録アイテム数約40000

・予備機
 同上(ただし、設定情報のみで、監視データなし)
------------------------------------------------------------------

本番機から取得したzabbixの設定のみのダンプを予備機にリストアし、
予備機を起動したところ負荷が急激に高くなり、アラートが多数発生しました。
※アラートが発生しつづけるため、zabbix server プロセスは停止しました。

その時は、unreachable processes 等がビジーになっていましたので、
一時的に応答がないところがいくつかあり、負荷が高くなったのではないかと
考えています。

しかし、本番機では応答があった設定なので、予備機で起動しても
通信できるはずと考えていましたが、このような状況になったのは、
一度に多数の監視が開始されようとし、負荷が高くなり、応答遅延が発生し、

トリガー条件式において「メンテナンス期間」を判定することは可能でしょうか

いつも参考にさせていただいております。

アクションの実行条件において指定する
・「メンテナンスの状態 期間外 メンテナンス」
という条件をトリガー条件式に組み込み出来るものか模索しております。
色々自力で検討してはおるのですが良いアイデアが浮かばず行き詰っております。
実現方法等、知見のある方いらっしゃればご教示お願い致します。

Zabbixバージョンは2.2.11を利用しております

どうぞよろしくお願い致します。

連続して検知した場合をあらわすトリガーについて

OS:CentOS 6.5
Zabbixサーバ:2.2.11
エージェント:2.2.7

ロードアベレージの値をみて、0.8以上を2回連続で検知したらメールを飛ばすようにしたい為、以下のようなトリガーを作成しました。

{Resource Template Linux:system.cpu.load[percpu,avg1].count(#2,0.8,"ge")}=2
※この条件の場合、「直近2個」の値の中で「0.8以上」の値の出現回数が「2回」という意味であってますでしょうか。

メールが飛んできたため値を確認すると、以下のようになっていて、
1回0.8以上を検知したら動作したようで、意図した通りに動作していないようです。
※アラートの発生時刻は、02:15:03でした。

”0.8以上を2回連続で検知”という条件にしたいのですが、どこが誤っているのでしょうか。
どのような条件を設定すればよいかご教示いただけないでしょうか。

■収集された値
2016/09/28 02:25:03 0.64
2016/09/28 02:20:03 0.6
2016/09/28 02:15:03 0.835 ★ここでアラート
2016/09/28 02:10:03 0.6
2016/09/28 02:05:03 0.32

コンテンツ配信