ZABBIXのメモリー使用量について

こちらのサイトでご教授いただいた情報やその他いろいろな
情報をもとに何とかZABBIXを試験導入して試しております。

そこでちょっと気になる点が出てきましたので、またまた
質問させてください。

最初のころはそれほど気にならなかったのですが、監視する
ポイントが増えるにしたがってか?メモリーの使用率が
かなり増大しているように思えます。このことが原因で
昨夜はZABBIX自体が落ちたようです。

今日サーバーでのメモリー使用量をチェックしたところ
ZABBIXでかなりの量を消費していることを確認し、さらに
メモリーの空きがほとんどなくなりかけていたので、一度
ZABBIXを再起動してみました。そうしたら、1/10以下くらい
までメモリー使用量が落ちたのですが、時間が経つにつれて
徐々にメモリー使用量が増え、3時間ほど経過しただけで
1GB以上のメモリーをZABBIXだけで食っているようです。

ちなみに仮想メモリーの方もほぼ同じくらい消費しています。

ちょっとメモリーを食いすぎなような気がしますので、どなたか
解る方や同じ症状で苦しんだ方がいらっしゃいましたら、ご教授
くださると助かります。

<使用環境>

★CPU:Xeon2.4 * 2
★Memory:2GB(RAM)、仮想メモリー(2GB)
★OS:RedHat Linux 5.1
★ZABBIX 1.6.2(同梱のエージェントをこのサーバー上のみ使用)

上記の環境で、ZABBIXとZABBIXに必要な物のみインストールした
状態での使用です。基本的にメモリーはZABBIX以外はほとんど
使用していない状態になっております。

↓ZABBIXのダッシュボードに表示されている情報

**********************************************

ZABBIXサーバの状態

パラメータ 値 詳細
ZABBIXサーバの起動 はい -
ホスト数 (有効/無効/テンプレート/削除済) 115 39 / 33 / 43
アイテム数 (有効/無効/取得不可)[トラッパー] 7529 1833 / 5693 / 3
トリガー数 (有効/無効)[障害/不明/正常] 1749 1734 / 15 [0 / 1141 / 593]
ユーザ数 (オンライン) 4 1
Required server performance, new values per second 9.3229 -

**********************************************

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー kodai の写真

こんにちは。

これまで同様の現象の発生や報告があったことはないのですが、経験上アイテム数が7000を超えるのは、監視項目数としては多い方だと思います。

監視間隔にもよるのですが、この規模の監視ですとMySQLのチューニングなどを適切に実施したり、メモリを増やすなどしないと、ZABBIXサーバの負荷が上がってしまうことがあります。

そこでいくつか教えて頂きたいのですが、

1. MySQLのチューニングは何かしら実施されているでしょうか?可能でしたらmy.cnfの設定を教えて頂けるでしょうか。
2. ZABBIXのWebインターフェースから、[管理] -> [キュー]の画面で、10分以上キューに溜まってしてっている監視項目はないでしょうか?
3. ZABBIXサーバを動作させているサーバのロードアベレージやCPUのIOwait値はどのようになっているでしょうか。

ユーザー k-ito の写真

kodaiさん、はじめまして。

レスありがとうございます。

本家の方で、同じ症状の方がいまして、その情報をもとになんとか
メモリーリーク問題を解決できたので、ご報告いたします。

この問題は、誤ったトリガー設定などが多数存在するとメモリー
リークを引き起こすようです。なので、監視ポイントを1/10以下に
しても、メモリーの減る量は減ったりはしましたが、徐々に徐々に
減っていくので、監視ポイントの数的な問題ではありませんでした。

なにぶん検証導入中でして、スイッチ系とかを一気にデフォルトの
テンプレートで登録たりしたので、値が取れていたり取れていない
などが多々存在していたりしまして、それに伴い多々あるトリガー
設定が意味を成していない物などが数多くあったことで、メモリー
リークがおきていたようです。

上記のような状態でしたので、一旦ほとんどのトリガー設定を無効に
しましたら、メモリーリークは止まり、現状はメモリーの減りもほぼ
なく、安定している状態です。

ちなみにキューの方はたまに30秒待ち迄は出たりしますが、基本的には
ほとんど待ちのない状態です。

いろいろとご指摘ほど、ありがとうございました。今後の参考にさせて
いただきます。

ユーザー kodai の写真

この問題は、誤ったトリガー設定などが多数存在するとメモリーリークを引き起こすようです。なので、監視ポイントを1/10以下にしても、メモリーの減る量は減ったりはしましたが、徐々に徐々に
減っていくので、監視ポイントの数的な問題ではありませんでした。

なるほど、そういうことだったんですね。有用な情報、どうもありがとうございました。