Template Module Linux CPU by Zabbix agentのトリガーについて
お世話になります。
標準テンプレート Template Module Linux CPU by Zabbix agentのトリガーについてご質問させてください。
利用バージョン Zabbix 4.4.0
Load average (15m avg)
Load average (5m avg)
Load average (1m avg)
上記3つのアイテムがありますが、全て同一のトリガーとなっております。
Load averageのトリガー条件式
---------------------
{Template Module Linux CPU by Zabbix agent:system.cpu.load[all,avg1].min(5m)}/{Template Module Linux CPU by Zabbix agent:system.cpu.num.last()}>{$LOAD_AVG_PER_CPU.MAX.WARN}
and {Template Module Linux CPU by Zabbix agent:system.cpu.load[all,avg5].last()}>0
and {Template Module Linux CPU by Zabbix agent:system.cpu.load[all,avg15].last()}>0
---------------------
すみません、条件式の書き方が全て把握できていないので恐縮ですが、
お伺いしたい事としては、上記の条件式の意味(Load averageのトリガー条件式)と、アイテムが複数あった場合、トリガーを1つにまとめる事が可能なのか?
という事をお伺いしたいです。(”/”と”and” が入っていた場合、どのような挙動になるのか)
お手数おかけしますがよろしくおねがいします。
TNK - 投稿数: 4720
”/”は通常の算術記号の割り算です。
”and”は論理学でのANDですので、同時に条件を満たすことを示します。
以下の3つの条件式を同時に満たすかという条件式だと思われます。
1つ目は、すべてのCPUでの1分間平均でのロードアベレージをさら
にそれらの値の5分間での最小値を、CPU数で割ったものが、マクロ
{$LOAD_AVG_PER_CPU.MAX.WARN}の値よりも大きいという条件です。
{$LOAD_AVG_PER_CPU.MAX.WARN}のデフォルトの値は、1.5になって
いると思います。
2つ目は、すべてのCPUでの5分間平均の最新値が0より大きいという
条件です。
3つ目は、すべてのCPUでの15分間平均の最新値が0よりも大きいと
いう条件です。
つまり、5分以上継続して平均すると各CPUに1.5個以上の処理中も
しくは処理待ちプロセスが存在していると解釈すれば良いのではな
いでしょうか?
可能です。
他の監視ツールで、1つのメトリクスに対してのみ条件が付けられ
るようなものがあったりすると思いますが、Zabbixでは複数のメト
リクスを元に障害かどうかを判断するという設定が可能です。
myyam - 投稿数: 63
TNK様
詳細な回答ありがとうございます。
それぞれ、3つの単品ではある程度把握できたものの、組み合わせた場合、結局どういう判定になるのか?
というのがイマイチでしたので、助かりました。ありがとうございます。
関数はこちらを参考にしていますが、4系の場合、新たに追加or 削除になっている関数などはあるのでしょうか?
(2.2以降ページ自体が無いようでしたので)
https://www.zabbix.com/documentation/2.2/jp/manual/appendix/triggers/fun...
TNK - 投稿数: 4720
英語ですが、以下のページを参考にしてください。
https://www.zabbix.com/documentation/4.4/manual/appendix/triggers/functions
4.0であれば、寺島さんの新しい方の書籍に日本語での簡単な解説
があります。
https://gihyo.jp/book/2019/978-4-297-10611-9
https://www.amazon.co.jp/dp/4297106116/
myyam - 投稿数: 63
TNK様
ありがとうございました。拝見させていただきます。