value cache working in low memory modeについて

いつもお世話になります。
ZABBIX3.0にてvalue cache working in low memory modeの障害が上がったのですが、
これは、キャッシュがいっぱいで、ハッシュテーブルが書き込めない状態なのでしょうか?
その後、ステータスは、OKになりましたが、キャッシュをすべてクリアした状態なのでしょうか?
また、デフォルトでトリガーが重度の障害に設定されていますが、この状態が続く場合は、
動作に問題がありますか?

ご教授頂けますと幸いです。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

値キャッシュ(Value Cache)は、アイテムで取得した値の履歴デー
タを、データベースにアクセスせずに、メモリ上に置いておくこと
で、各処理を高速化するために用意されています。

low memory modeになってしまうと、メモリ上に十分なキャッシュ
を確保できずに、それまでキャッシュを利用することで高速化でき
ていたトリガーの条件式の評価やマクロの展開などをするたびに、
データベースへのアクセスを行ってしまうようになるので、Zabbix
全体の処理のレスポンスが低下してしまうと思います。

可能性としてはですが、アイテムの値の取得処理がキューに溜まっ
てしまったり、障害を検知して通知するまでの処理が遅延するなど
の影響がでてしまうことが懸念されます。

そういったレスポンスの低下や処理遅延を避けるためには、キャッ
シュのサイズのチューニングを行った方がよいのではないでしょう
か。

各キャッシュの利用状況は、「Template App Zabbix Server」を利
用してホストスクリーンを参照するとグラフで確認することができ
ます。
各キャッシュの設定は、zabbix_server.conf内で指定してください。
https://www.zabbix.com/documentation/3.0/manual/appendix/config/zabbix_s...

ステータスがOKに戻ったのであれば、再度、値キャッシュを使用で
きる状態に復帰していると思います。

ユーザー kyouji-east の写真

TNK様

 ご返答ありがとうございます。
low memory modeの件、このモードになると直接
DBにアクセスする事で、通知までの処理の遅延等影響が出る可能性があるとの事
了解しました。
このモードのフラグが立って、7時間ほどして復旧しているのですが、
これは、キャッシュがクリアされた?時間が経つと再生成するのでしょうか?
(復旧するタイミングはなんでしょうか?)
現状、直接webでアクセスできないところにあるので、グラフが見れないのですが、
Less than 5% free in the value cacheなどの障害情報も上がっていないようです。
(見落としもあるかもです。)
3ヶ月ほど、アイテムや監視対象も増やしていないので、(通常cacheのfree率も95%程度)
なぜ、low memory modeになったのかと思っています。
頻繁に上がるのであれば、キャッシュサイズを上げる(デフォルト設定ですので8Mだと思いますが)
事も考えます。

上記の、low memory mode復旧のタイミングがわかればよろしくお願いいたします。

ユーザー TNK の写真

具体的な実装は確認していませんが、モードの切り替えに関しては、
リリースノートに1日に1回と書いてあります。

 Release Notes : Zabbix 3.0.0
   http://www.zabbix.com/rn3.0.0.php

最終的な実装とは合致していないかもしれませんが、実装方針に関
しては、以下のURLにある情報を確認してみてください。

 Docs/specs/ZBXNEXT-322
   https://www.zabbix.org/wiki/Docs/specs/ZBXNEXT-322
 ZBXNEXT-2474 : Improve value cache low memory mode handling
   https://support.zabbix.com/browse/ZBXNEXT-2474

もともと各種キャッシュは、共有メモリを利用していたと思うので、
共有メモリを利用する他のキャッシュやアプリケーションによって、
共有メモリが消費されていたのかもしれません。

値キャッシュだけではなく、他のキャッシュの状態や、共有メモリ
の状態なども確認してみてください。
あと、利用されているバージョンが最新の3.0.4ではないのであれ
ば、脆弱性の問題がありますし、バージョンによってはキャッシュ
の処理の改善が行われていますので、3.0系でも最新のバージョン
を利用するようにしてみてください。

ユーザー kyouji-east の写真

TNK様

 早々の回答ありがとうございます。
リリースノート内のモードの切り替え確認いたしました。1日1回スイッチバックするとありましたので
起動後24時間とかで、モードの状態をみているのでしょうか。コマンドで、切替ができればよいのですが、
再起動等で、対応するしかなさそうですね。
あと、ご指摘の他のキャッシュやメモリの状態も確認したいと思います。
現状、ver3.0.2を使用していますので、実稼働中でなかなかバージョンアップできないのですが、
機会を見つけて、上げたいと思います。
いつも、ご教授ありがとうございます。

ユーザー kyouji-east の写真

TNK様

 早々の回答ありがとうございます。
リリースノート内のモードの切り替え確認いたしました。1日1回スイッチバックするとありましたので
起動後24時間とかで、モードの状態をみているのでしょうか。コマンドで、切替ができればよいのですが、
再起動等で、対応するしかなさそうですね。
あと、ご指摘の他のキャッシュやメモリの状態も確認したいと思います。
現状、ver3.0.2を使用していますので、実稼働中でなかなかバージョンアップできないのですが、
機会を見つけて、上げたいと思います。
いつも、ご教授ありがとうございます。