日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

SNMPTTインストール時に"/usr/share/snmptt 配下が作成されていないのは正しいのでしょうか?

お世話になっております。
以下の環境でZabbixの構築中です。

CentOS6.6 x64
zabbix.x86_64----2.4.6-1.el6
net-snmp.x86_64--1:5.5-54.el6_7.1
snmptt.noarch----1.4-1.el6

■質問の経緯
Zabbix構築にあたっては以下のあぱーブログ様の記事を参考にしました。
https://blog.apar.jp/linux/334/

この延長で、SNMPトラップの設定も同ブログの下記の記事を参考にしました。
https://blog.apar.jp/zabbix/2184/

SNMPTTの設定までして、トラップ受信の動作確認をしましたところ
/var/log/messages へのsnmptrapdが出力するログは出力されていましたが
/var/log/snmptt/snmptt.log へのログ出力はありませんでした。

いろいろ試行錯誤の結果、
上記ブログ記事の snmptrapd.conf で設定している
「perl do "/usr/share/snmptt/snmptthandler-embedded";」
の/usr/share/snmptt/snmptthandler-embedded というファイルがなく

ログ指定回数出力されたらアラート通知

お世話になります。

/var/log/messages内に一定期間内に特定文字列を〇個以上出力されたら検知するようにしたいと思っております。

動作未確認ですが、以下のような書式で実現可能でしょうか。
({サーバ名:log[/var/log/messages,@messages].count(120m,"failed:")}>3)and (({サーバ名:log[/var/log/messages,@messages].nodata(7200)})=0)

上記条件文は2時間以内に"failed:"の文字列が4つ以上出力された場合に検知することを想定しております。
調べた結果"count”関数のやり方しか見つけられませんでした。

また一定期間内に2回連続で検知した場合(例えば3時間以内に2回連続で"failed:"の文字列が出力)に検知できる方法もあれば教えて頂けないでしょうか。
(こちらを実現する方法が見つけることができませんでした)

アドバスを頂けると幸いです。
よろしくお願い致します。

ウェブ監視の突然の停止

ウェブ監視が突発的に停止し、監視不能状態になることがしばしばあります。
解決方法、調査方法等アドバイスいただけますと幸いです。

【環境】
zabbix-server 2.2.2
zabbix-agent 2.2.1

【ウェブ監視】
- シナリオ
認証なし
更新間隔60秒
リトライ1
エージェント Internet Explorer10.0
HTTPプロキシあり

- ステップ
ステップは3つで
URLのみ指定
タイムアウト0秒
要求文字列なし
ステータスコードなし

そのほか
・HTTPプロキシが別で、それ以外の設定が異なるアイテムはあり。
・同様の設定のサーバがもう1台あり。

【事象】
・ウェブ監視作成後に問題なく動作するが、突然値が取得できなくなり復旧しない。
・停止するウェブ監視は動作するサーバ、経由するHTTPプロキシにかかわらない様子。
・「監視データ」→「最新データ」の画面で「最新のチェック時刻」が古い状態。
・「Web監視の設定」上のステータスは有効。
・無効→有効としても値の取得は再開しない。
・複製でシナリオを作成すると、そのアイテムはちゃんと動作する。(が、突然値が取得できなくなる)

Zabbix agent on <ホスト名> is unreachable for 5 minutes について

いつも参考にしております。

Zabbix Server のバージョンは、2.0.4 です。

タイトルに記載したトリガー
・Zabbix agent on <ホスト名> is unreachable for 5 minutes
ですが、デフォルトのトリガー式は以下の通りかと思います。
・{<ホスト名>:agent.ping.nodata(5m)}=1

アイテム[agent.ping]は、[1]以外の値はないと思いますので、上記のトリガーは 5 分間何も受信されなければ条件に当てはまると考えております。

値が取得されているにもかかわらず、上記のトリガーが反応しましたので、このような状況を経験された方、もしくは原因が分かる方がいらっしゃれば、と思い、ポストしました。
受信した値の一覧を記載しますが、連続で受信しているにも関わらず、トリガーが反応しているようでした。

拙い説明ですが、よろしくお願いいたします。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
2015-08-14 08:15:26 1439507726 1
2015-08-14 08:14:26 1439507666 1
2015-08-14 08:13:26 1439507606 1

障害発生時の自動アクション

タイトルにある通り、障害発生を検知した際に自動アクション機能を使用したいと考えてます。
自動アクションとしては、スクリプトの実行とメール送信を想定しています。

障害毎にアクションを分けたいと思っており、また障害毎にメール送信先を変えたいと思ってます。
※Aシステムの障害は「Aシステム関係者」に通知。
  Bシステムの障害は「Bシステム関係者」に通知。
  Cシステムの障害はスクリプトを実行と「全社」へ通知。

初心者で申し訳ありませんが、ご教示願いたく。
宜しくお願い致します。

コンテンツ配信