マルチコアの時の閾値

トリガーの設定で、Template_Linuxを使用しています。
これはたぶんCPU1個を想定したものだと思いますが、
CPU複数の時の一般的な閾値ってあるのでしょうか?
たとえばloadはデフォルトが5で障害通知となっていますが、
4コアのときは20とかにするべきなのか・・・
プロセス数も300以上でアラートになりますが、いくつぐらいが
いいのか・・・([migration/0]などがコア数分あったりしますが、
その分を上乗せするだけでいいのか・・)
process runningもデフォルトは10ですが・・・
もちろんCPUのidle等をみて臨機応変に変えるべきだとは思うの
ですが、何か指針があればなあと思います。
ヒントなどあれば教えてください。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー kodai の写真

こんにちは。

リソース監視の閾値は、サーバのハードウェア構成や動作しているアプリケーション、定常的にかかる負荷具合によっても変わってきますので、一概にこの数値でOKというものでもありません。

デフォルトのテンプレート設定はあくまでサンプル設定ですので、

1. 一定期間、監視を行ってみる
2. 監視結果をもとに、適切な閾値を設定してみる
3. 一定期間監視を行って、閾値を修正する

といった具合に、試行錯誤されるのが一番良いと思います。

というのが一般的な回答にはなるのですが、ご質問にあったロードアベレージ値は、プロセッサ1つを想定していると思います。4コアある場合は、より大きな数値にしておかないとすぐにアラートメールが送信されてしまう場合があると思います。

システム運用を行いつつ、サーバの負荷が高いと感じるときのロードアベレージ値を見ておいたり、監視しておいて一定期間のロードアベレージ値の最高値を見るなどして、システムに適した監視設定を見つけるのが良いと思います。

ユーザー yatsu の写真

返答ありがとうございます。

やはり一般的な解みたいなのはないのですね。
テンプレートのサンプル設定もなにかしら意味があってあの数字になっているとおもいますが、それがどうやって出たものかがわかればなーと思いました。
とはいえ1コアであっても環境に合わせて閾値は変えるべきですものね・・・
しばらく動かしてみて、グラフとにらめっこしながら変えていくようにしようと思います。