トリガーの動作間隔について
初めて投稿いたします。
現在、zabbix:Ver1.4.5、OS:CentOS5で監視環境を構築しています。
icmppingを用いての死活監視で以下の条件を念頭においています。
・Itemの更新間隔は10秒
・60秒間Ping応答が無い場合に障害と認定(トリガ作動)
こちら条件をもとに以下の設定を行いましたがうまく動作していない状態です。
・Itemのicmppingにて更新間隔は10秒に設定
・Triggerの設定
{ホスト名:icmpping.count(60,1)}=0
テストで監視対象機器のLANケーブルを抜去すると、60秒を待たず
にアラートが発生します。
last(0)=0にてトリガ設定しているケースとアラート発生のタイミングは同じように見受けられます。
データ収集の状況を確認すると1分おきに値を取得しているようで
(10秒おきの結果は表示されていない)あり、こちらが原因で
うまく動作していないように感じております。
#zabbix_server.confなどをいじればうまくいくのでしょうか?
設定含めて行き詰っておりますので、
アドバイス等頂けると幸いです。
kodai - 投稿数: 1341
こんにちは。
ご質問の内容はアイテムとトリガーの設定がそれぞれ独立した問題になりますので、それぞれ個別に回答させて頂きます。
1. Itemのicmppingの更新間隔が10秒にならない
fpingを利用するアイテムicmppingとicmppingsecの更新間隔は、zabbix_server.confにあるPingerFrequencyの設定で決まり、Webインターフェースから設定できる更新間隔の値は無視されるようになっています。
デフォルト値は60秒ですので、変更する場合はzabbix_server.confの以下の行のコメントアウトを外して値を変更後、zabbix_serverを再起動してください。
<code> #PingerFrequency = 60</code>
2.トリガー設定について
トリガー関数で count(60,1) と設定すると、「直近の60秒以内のヒストリにデータ『1』が存在する数」を返すので、=0としてしまうと望まれている動作にはなりません。
<code>{ホスト名:icmpping.count(60,1)}=6</code>
と設定するとうまくいくはずです。
ただし、上記の設定だとネットワーク的な遅延などは考慮されていないため、例えば
<code>{ホスト名:icmpping.count(90,1)}=6</code>
などのように、検知する期間は少し長めに取っておいた方がより正確に動作すると思います。
tm2 - 投稿数: 2
お世話になります。
頂いたアドバイスを元に操作したところ、
無事思った通りの動作となりました。
zabbix_server.confは何度も確認したつもりでしたが、
"#PingerFrequency = 60"の設定は見落としていました。
(confの設定がwebより優先されるということも)
非常に参考になりました。
ありがとうございます!!
bird - 投稿数: 21
こんにちは。いつもお世話になっております。
1.6で同様な設定(※)を試みたところ、トリガー設定部分が、
{ホスト名:icmpping.count(90,1)}=6
だとうまくいきませんでした。
結果的に、
{ホスト名:icmpping.count(90,0)}>6
としたところ、うまく動いているようです。
※
90秒間中に10秒ごとにping送信し、
0(=icmppingで接続不可時に返す値)の値を返した回数が合計6回越えたら、
トリガーを発動する。
⇒この定義・考え方が間違ってるのかもしれませんが・・・。
kodai - 投稿数: 1341
count関数は、{ホスト名:icmpping.count(90,1)}>6と設定した場合、
アイテムicmppingで取得した値を利用して、
<li>過去90秒のデータのうち</li>
<li>値が1であるものが</li>
<li>6回以上あれば真</li>
となりますので、90秒ごとにping送信し...というのは間違いですね。
icmppingは成功すると1、失敗すると0を返すので、{ホスト名:icmpping.count(90,0)}>6で正しい動作になっているのではと思います。以前の私の回答では(90,1)としていましたが、間違いだったようです。
アイテムが返す値はマニュアルに詳細が記載されていますので、そちらを確認してみてください。