障害発生中にhost unavailableが起きた場合のトリガーステータスについて

2018/04/27 - 18:49 (金) jusco0103 - 投稿数: 28

日本Zabbixユーザー会フォーラム

いつもお世話になっております。
掲題の件について、質問させていただきます。

Agentを導入しているPCが9:00-18:00の間は稼働し、時間以降はシャットダウンするという環境です。
Agent側で障害が発生し、ZabbixServerで障害検知した後にAgentがシャットダウンした場合、
検知した障害が残り続けてしまう事象が発生しています。
（一例として障害検知したトリガーを文末に記載しております。）

上記の状態になると、新しくアイテム取得する翌日9:00まで障害が残り続けるため、
なんとか解消したいと考えております。
対策としては、シャットダウン中はPingが通らないことから下記のようなトリガー条件式で回避するしかないか、と考えております。

{トリガーxxx} and {テンプレート名:icmpping[].count(10s,1)}=1

ただし営業時間中にPingDownするような場合があると、障害検知できなくなる恐れがありいい方法とは思えません。
現在以下のような構成、トリガー設定なのですが、もし他に解決方法がございましたらご教示いただけませんでしょうか。

◆構成情報
・Zabbix-Server
Version : 3.0.16-1.el6
OS : Amazon Linux AMI(2017.09)

・Zabbix-Agent
Version : 3.0.16-1+xenial_i386.deb
OS : Ubntu16.04.3 LTS (Xenial Xerus)

◆トリガー
{Template Test:system.cpu.load[percpu,avg1].avg(5m)}>1

お手数をおかけ致しますが、何卒宜しくお願い致します。

ログイン（登録）してコメントを投稿

2018/05/09 - 14:24 (水)
tsukune - 投稿数: 6

対象のアイテムは、シャットダウンしたら復旧にしていいのであれば、
考えている方法でも問題無いかと思います。

＞営業時間中にPingDownするような場合があると、障害検知できなくなる恐れがあり
このトリガーとは別に、Ping監視用のアイテムとトリガーを実装すれば良いと思います。
営業時間中のシステム停止はこのPing監視で気づけます。

システム停止中は取得できるはずもないアイテムについては、PingDownを考慮するのではなく、
別途PingDownを気づく方法を用意しておけばいいと考えます。

ログイン（登録）してコメントを投稿

2018/05/14 - 11:23 (月)
jusco0103 - 投稿数: 28

tsukune様

ご連絡が遅くなり申し訳ございません。
Pingによる監視と、その他の監視を別々に用意するということですね。
ご教示いただき、ありがとうございます。

ログイン（登録）してコメントを投稿

2018/05/09 - 16:10 (水)
karna - 投稿数: 60

ほかに、nodata関数を使えば、アイテムの取得がなくても３０秒ごとにトリガーが判断されるので、たとえば、１０分間更新がなければ正常に戻すといった処理が可能です。
ただ、３０秒ごとに処理されるので、障害を継続して検知させると、３０秒ごとにアラートがあがります。

>ただし営業時間中にPingDownするような場合があると、障害検知できなくなる恐れがありいい方法とは思えません。

高負荷状態と、通信不可は別系統の障害なので、tsukuneさんの言うように、別々のトリガーを設定するべきだと考えます。
(ping downする前に必ず高負荷になるわけではないし、downしていたら監視できないので、目的のトリガーではアラートは上がらない)

ログイン（登録）してコメントを投稿

2018/05/14 - 13:23 (月)
jusco0103 - 投稿数: 28

karna様

ご連絡が遅くなり申し訳ありません。
ご教示いただきありがとうございます。
確かにnodataでしたら、更新がなくなればトリガーを正常に戻すことができますね！
検証して、導入できるか確認してみます。

ログイン（登録）してコメントを投稿

日本Zabbixユーザー会

障害発生中にhost unavailableが起きた場合のトリガーステータスについて

コメント表示オプション

jusco0103さんについて

新しいフォーラムトピック

活発なフォーラムトピック

ユーザーログイン

Twitter