【パフォーマンス問題】Zabbixダッシュボードに表示されている内容について
現在Zabbix2.2を使用しており、下記の画面が表示されております。
Zabbixに詳しい方から見ると、このZabbixの活用/運用方法に何か問題はあるでしょうか?
(「重度の障害:4590件」や「障害あり:1400件」の件数が多く、この使い方で正しいのか疑問に思い投稿致しました)
何かアドバイス等頂ければ幸いです。よろしくお願いします。
> ○Zabbixサーバの状態
> パラメータ 値 詳細
> ホスト数 (有効/無効/テンプレート) 2783 2739 / 16 / 28
> アイテム数 (有効/無効/取得不可) 75104 48769 / 25663 / 672
> トリガー数 (有効/無効)[障害/不明/正常] 38376 35562 / 2814 [4697 / 0 / 30865]
> 1秒あたりの監視項目数(Zabbixサーバーの要求パフォーマンス) 5285.86
> ○システムステータス
> ホストグループ 致命的な障害 重度の障害 軽度の障害 警告 情報 未分類
> Servers 0 4590 0 102 0 0
> 更新時刻: 15:30:40
> ○ホストステータス
> ホストグループ 障害なし 障害あり 合計
> Servers 1338 1400 2738
> 更新時刻: 15:21:46
karna - 投稿数: 61
件数の情報だけだと、何とも言い難いですが、感想程度でよろしければ
・> 1秒あたりの監視項目数(略)
は多い気がします。
スペック的に問題がなければよろしいのですが、監視間隔、監視項目の見直し等をした方がよいかもしれません。
・半分のホストで、平均3件、重度な障害が起きているというのは、(自分がかかわってるとしたら)システムとしてどうかと思いますので、
本当に問題が発生しているなら、システム側の見直しが必要でしょう。
ただ、実際には不要な監視項目だったり、閾値が過敏だったりして障害判定されているのではないでしょうか?
(なんとなくですが、ネットワーク機器のポートLinkDown を監視されているとしたら、条件式を変えるか、未使用ポートは無効にするとかすると、減らせそう。)
mukai - 投稿数: 4
ご返信ありがとうございます。
> ・> 1秒あたりの監視項目数(略)
> は多い気がします。
> スペック的に問題がなければよろしいのですが、監視間隔、監視項目の見直し等をした方がよいかもしれません。
なるほど、現在1台(2コア)のマシンにZabbix[AP,DB,Web]と別の仕組み[AP,DB,Web,バッチ]を乗せていて非常に重たいのもそれが原因かもしれません。
> ただ、実際には不要な監視項目だったり、閾値が過敏だったりして障害判定されているのではないでしょうか?
本当は確認したいのですが、画面上だと応答が遅い(数分待ってORAエラーが返ってくる)ので、現在設定を見直そうにも難しいかもしれないです。