監視間隔について

いつもお世話になっております。
このたび監視間隔の設定について悩んでおりまして、ご教授いただけないでしょうか。
アイテム監視間隔について、5分間で設定した場合に取得される値は、5分間の平均値なのでしょうか。
それとも、取得時の値なのでしょうか。

例えば閾値監視の間隔を5分間とし、CPU等の使用率が90%を超えたら障害とした場合、
5分間の中で一瞬90%に上がっても検知しないのでしょうか。

初歩的な質問になり大変申し訳ありませんが、何卒よろしくお願いいたします。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー heya の写真

取得時の値です。
ただ、system.cpu.util など一部のアイテムは、「x 分間の平均」(x は 1,5,15)を取得するアイテムなので、取得時に「x 分前からその時点までの平均」を調べて返します(実際はカーネルに問い合わせるだけでしょうが)。
どのアイテムがどういう値を返すのかはマニュアルを見てください。
https://www.zabbix.com/documentation/2.2/jp/manual/config/items/itemtype...

CPU使用率については、メモリやディスクと違って時間での割合、つまり「ある一定期間の間に CPU を使っていた時間は期間の長さに対して何%か」というものなので、ある瞬間の使用率というのは本来ありませんよね。なので、「5分間の中で一瞬90%」というのだとちょっと曖昧な表現になります。

メモリなどはその瞬間での使用率を出せるので、前回取得時から今回取得時までの間に一瞬だけ90%を超えていた場合それを検知できるかどうか、という話ができますが、この場合「検知できない」ということになります。なるべく検知漏れを少なくしたいなら、更新間隔を短くするくらいしか手はないと思います。

ユーザー ASG の写真

早速のご回答ありがとうございます。

CPUやメモリ、ディスク等のアイテムでは、平均値を返す仕様であること理解いたしました。
更新間隔を短くして検知漏れに対処したいと思います。

こちら疑問に思っていたことが全て解決できましたので、閉めさせていただきます。
ご対応いただきありがとうございました。

ユーザー heya の写真

>CPUやメモリ、ディスク等のアイテムでは、平均値を返す仕様であること理解いたしました。
違いますよ。
system.cpu.util は平均ですが、vm.memory.size や vfs.fs.size はその時点での値です。具体的にどれが平均かというのはマニュアルを見ていただくと分かります。

ユーザー ASG の写真

heya様

ご回答ありがとうございます。
ご返信が遅くなり、大変失礼いたしました。

リソース監視でも、メモリやディスクの取得値は、その時点での値であること承知いたしました。
これらのアイテムは、監視間隔を短くして精度を高めることを検討いたします。
その他のアイテムについても、マニュアルを参考に監視間隔を決めて参ります。

ご丁寧に回答いただきありがとうございました。