日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

メール通知の運用に関しまして

いつもお世話になっております。
Zabbixによるメール通知の運用について質問が御座います。

現在Zabbix 3.2を使用して何台かのサーバを監視しているのですが、
障害が発生した時のメール通知の設定に悩んでいます。

今の設定では障害発生時と復旧時のみメール通知を行う設定となっているのですが、
これだと障害発生時のメールに気づけなかった場合にそのまま放置してしまう恐れがあります。(実際にありました。。)
かといって何度も送信するようにすると、早急に対応できない場合に何通もメールが届くことになってしまい、
私以外にも受信している人がいるのでそちらに迷惑がかかってしまう、といった次第です。

自分が何を優先するかで運用を決めればよいとは思うのですが、監視というものをやり始めたばかりで
近くに相談できるものもいないため、こちらで皆様のメール通知の運用に対するお考えをお伺いできればと存じます。

・メールは障害発生時のみ送信する。
・障害が復旧するまで定期的に送信する。
・基本は定期的に送信し、気づいたら手動で止める。

上記のうちどのような設定にしているか、可能であればその理由についてもお答えいただけますと幸いです。
何卒よろしくお願い致します。

監視対象が複数ある場合の再検知について

ログ監視について以下の事象が発生しております。

【Version】
◆zabbix_server:2.2.2
◆zabbix_agent:2.2.2

【設定(アイテムのキー)】
◆logrt["/var/log/***/app.log.[0-9]{8}$"]
 ⇒更新間隔:60秒

【環境】
◆監視対象のファイルは「app.log.yyyymmdd」の名称で毎日00:00に作成されます。
◆古いログファイルはcronで毎日00:20に圧縮されます。
◆そのため00:00~00:20は監視対象ファイルがディレクトリに2つ存在します。

【事象】
◆ログの出力元のアプリケーションの仕様上、一連の処理を同一ファイルに書き込むため古いファイル(前日ファイル)に更新がかかる場合があります。
◆前日のファイルを読み込んだ際に先頭行から読み込むため再検知が発生します。

【相談】
◆事情によりアプリ側のログ出力設定の改修は難しい。
◆何か解決策はありますでしょうか。

上記、もし解決策があればご教授頂けますでしょうか。
宜しくお願いします。

AWSのインスタンスタイプに応じたトリガー条件の設定について

AWSのT2インスタンスの監視についてですが、t2.small、t2.largeといったタイプごとに閾値を可変にする
方法はあるのでしょうか?

Zabbixのホストインベントリにおける「タイプ」の列で、T2インスタンスのタイプは確認できますが、これをトリガーの条件式に使えないのでしょうか。

CPUCreditBalanceというアイテムについて、「タイプ」がt2.smallの場合は30未満でアラーム発生、
t2.largeの場合は60未満でアラーム発生といったことがしたいです。

よろしくお願いします。

SSHエージェントの監視ができない

SSHエージェントで監視設定を行いましたが、最新データから「Support for SSH checks was not compiled in.」と表示され、監視できません。
初歩的な質問かもしれませんが、原因をご教示頂ければと思います。

設定は下記の通りです。
Zabbix-server:CentOS release 6.5 (Final)
監視対象:CentOS release 6.5 (Final)

アイテム設定
名前:hogehoe
タイプ:SSHエージェント
キー:ssh.run[hogehoge]
ユーザー名:root
パスワード:XXXXX
実行するスクリプト:hostname
データ型:文字列

Zabbixサーバ、エージェントのバージョンについて

Zabbixで以下のようにマネージャよりエージェントのほうが
バージョンが高い場合正常に監視できますでしょうか?

zabbixサーバ:2.2
zabbixエージェント:3.2
監視項目:CPU使用率、メモリ使用率、ディスク使用率(ローレベルディスカバリ)

マネージャよりエージェントのほうが高ければ問題ないようですが、
今回はその逆となります。

コンテンツ配信