奇妙なトリガーエラー

zabbix 画面にてトリガーの登録を行っていたら
下記の画像のような奇妙な現象が発生しました。
http://www.katsakuri.sakura.ne.jp/src/up0014.jpg

上下二つのトリガーの登録内容は全く同じなのですが、
上は正常に登録され下はエラーとなっています。
10 分以上放っておいても変わりません。

困っており、何かコメントいただけると大変助かります。

■環境
zabbix server 1.8.4
CentOS 5

以上、よろしくお願いします

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー ayoshida5 の写真

上記に追記です。
zabbix サーバを再起動したら両方とも赤色になりました。

一点確認したいのですが、トリガーの設定変更を行った後は
agent や server の再起動は必要でしょうか。

再起動を行わなくても設定変更が反映されることもあるので、トリガーの設定変更時に
「原則再起動必要」なのか「再起動不要」なのか戸惑っています。

以上、よろしくお願いします

ユーザー fripper の写真

トリガーやアイテムの設定は、再起動は不要です。

おっしゃっているトリガー側の判定条件については、
◆CPU負荷 などのように、
 「取得してきたデータが定期的に登録される場合向けのチェック」
◆イベントログ などのように
「出力されたらそれが登録される場合向けのチェック」
があり、今回の問題点は、2番めのほうに該当しているのが原因です

基本、トリガーの「問題があるか否か」の判定処理は、下地となっているアイテム側への新規データ到着時にしか実施されません。

CPU負荷等のチェックの場合は、1分おき等、定期的に
新しいデータが届くうえ、チェック用の判定処理も「last()」などとなっています
そのため「登録済データの最後の値がいくつだったら‥」みたいな判定をするので、
アイテムに対して、データが収集されたあとにトリガーを登録しても、正しく判定されます。
おおよそ問題を感じないのはこのためです。

対して、イベントログやログファイル系(log等)の判定の場合には、話が変わってきます
先述のとおり、「新規データ到着時にしか、トリガーの条件判定は実施されません」

ログチェック等の場合には、1度収集されたログは再度収集されないようになっているため、
一度、エラーと判定されてしまうと、次の新しいログが出力されて、ZABBIXサーバに登録され、
正常と判定されるまで、エラーになったです

同じように、一度正常と判定されてしまうと、次の新しいログが出力されて、ZABBIXサーバに登録され、
エラーと判定されるまでは、エラーのままになります

今回、問題になっている例では、時系列的に

1)アイテムを登録
2)トリガー(TEST3)を登録
3)アイテムにログデータが登録される
4)トリガー3の判定が行われ、エラーと判定される
5)トリガー(TEST2)を登録
6)その後、新規データは届いていない

という流れだったのではないでしょうか?

再起動後には、両トリガーとも、「エラー」判定になった、との
ことですが、「再起動時にだけ」は、直前に登録されたログデータを基に
再度条件の判定を行うようにコーディングされているので、
エラーが発報されたのだと思います

いかがでしょうか?

ユーザー ayoshida5 の写真

fripper さん

お返事遅くなり、大変申し訳ございませんでした。

> トリガーやアイテムの設定は、再起動は不要です

了解しました。ありがとうございます。

> 対して、イベントログやログファイル系(log等)の判定の場合には、話が変わってきます
> 先述のとおり、「新規データ到着時にしか、トリガーの条件判定は実施されません」
>
> ログチェック等の場合には、1度収集されたログは再度収集されないようになっているため、
> 一度、エラーと判定されてしまうと、次の新しいログが出力されて、ZABBIXサーバに登録され、
> 正常と判定されるまで、エラーになったです

この件について、先ほどこちらで偶然気づくことができました。
テキストログ監視の場合、テキストログを更新すると判定が再び行われ、
明らかに正しく設定しているのに赤色になっていたトリガーが
緑に変わったことを確認できました。

対して、CPU負荷 などのように、
「取得してきたデータが定期的に登録される場合向けのチェック」については
監視する値が定期的に更新されるので、
手動で更新しなくても常に監視の判定が正しく表示されるとのことで安心しました。

> 1)アイテムを登録
> 2)トリガー(TEST3)を登録
> 3)アイテムにログデータが登録される
> 4)トリガー3の判定が行われ、エラーと判定される
> 5)トリガー(TEST2)を登録
> 6)その後、新規データは届いていない

> という流れだったのではないでしょうか?

ご指摘の通りです。

懇切丁寧にご説明いただき本当にありがとうございました。
本件はこれでクローズいたします。