プロセス停止時間の監視について

お世話になります。Zabbix初心者です。

以下の監視が可能であるか、また、どのようにトリガーの設定をすればよいか
ご教授いただきたく、投稿させていただきます。

【監視内容】
5分(300秒)間隔のLinuxサーバのプロセス監視において1分(60秒)以上プロセスが停止していたらアラートを発報する。

【環境】
Zabbix 2.2.11
サーバーOS RHEL6

現在アイテム上で監視間隔を5分にして、プロセスが停止した場合にアラートを発報するテンプレートを作成して
監視に使用していますが、短時間(10秒程度)のプロセス停止が多いことから、60秒以上のプロセス
停止が発生していたら検知できるようにしたいと考えております。
いろいろ調べてみたのですが、そもそもZabbixで上に述べた監視設定が出来るのか、どのようにすればよいのか
がわからないため、皆様のお知恵をお借りできればと思っております。

【設定しているトリガー】
{テンプレート名:proc.num[プロセス名].last(0)}=0

自分なりに以下のトリガーを作成してみたのですが、自身がございません。
誤りがあればご指摘いただけますと幸いです。

{テンプレート名:proc.num[プロセス名].max(60)}=0
※ 監視間隔内で60秒プロセス数の最大値が0というイメージで作成しました。

ご教授よろしく御願いいたします。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー kaeru の写真

>>FLAD様
1分単位でのアイテム推移となりますと、基本的に1分以下の間隔でアイテムを取得する必要があるかと思います。
ご記載頂いた現在設定されているトリガーですと、
5分間隔でアイテムを取得し、値が0であれば障害となっているため、
短時間(10秒程度)で停止しているタイミングでアイテムを取ってしまうと障害となってしまいます。

また、新たに作成していただいたトリガーですと60秒間での最大の値が0であれば障害なっておりますが、
こちらも上記と同じくトリガーで評価されるアイテムを5分間隔で取得しているためご希望の動作にはならないと思われます。

アイテム取得間隔を5分から30秒とするなど、監視間隔自体の変更はご検討は出来ますでしょうか

ユーザー FLAD の写真

kaeru 様

コメントいただきましてありがとうございます。
監視間隔の変更は検討可能です。

監視間隔を5分としていたのは構築当初監視要件が決まりきっていなかったため
暫定的に5分にしていてそのままになっていたと聞きました。

監視間隔を1分以下(最小値が30秒と認識しておりますが)に設定した上で
トリガーの設定を投入できればと考えております。

ユーザー kaeru の写真

監視間隔を30秒とするのであれば、ご記載頂いた以下の式でも良いかと思います。
{テンプレート名:proc.num[プロセス名].max(60)}=0

ただ、30秒と60秒で値を取ったら
たまたま想定される短時間のプロセス停止時間だっため障害になった…ということも考えられますので
maxの秒数を120秒、150秒にするなどある程度冗長性を持たせた方が良いかと思います。

ユーザー FLAD の写真

kaeru 様

ご教示いただきましてまことにありがとうございます。
監視間隔を30秒に変更してみます。
また、maxの秒数につきましても冗長性を考慮して検証してみたいと思います。

本当に助かりました。ありがとうございます。

ユーザー kaeru の写真

>監視間隔を1分以下(最小値が30秒と認識しておりますが)
すみません。コメントを漏らしておりました。
本筋と関係ありませんが、
監視間隔の最短値は1秒で、0秒は基本的にポーリングをしない例外の更新間隔となります。

ユーザー FLAD の写真

kaeru 様

ご連絡が遅くなり大変申し訳ございません。
ご教示いただいたトリガー、アイテム取得間隔30秒の組み合わせで実装が出来ました。
maxの秒数につきましては様子を見て変更することとなりました。

ありがとうございました。