Zabbixサーバのtimerプロセスのメモリリークについて
お世話になっております。
現在、管理しているZabbixサーバでメモリリークの問題が発生しており
いくつか質問させて頂きたいです。
Zabbixバージョン:1.8.5-1
サーバサイズ:m1.large(AWS)
メモリ:7.3GB
CPU:4ECU
過去のフォーラムを参照したところ
Zabbix起動時のメッセージで出力される
各プロセスの役割を確認できるとの事なので
リークしているプロセスを確認したところ
「timer」のプロセスでメモリがリークされている事が分かりました。
http://www.zabbix.jp/node/1874
過去のリリースノートを確認し
こちらのプロセスに関する不具合を確認いたしましたが
特に見受けられませんでした。
Web上で情報を探してみましたが
メンテナンス設定に絡むものと、いったもの以外に特に見つけられませんでした。
以下の質問についてご回答をお願いしたいです。
①「timer」のプロセスの役割についてご教授頂けますでしょうか。
②メンテナンス中の監視ホストのアイテムがキューにたまり続けているのですが
こちらとメモリリークは関係ありますでしょうか。
Zabbxiサーバ起動時ログ(一部抜粋)
-------------------------------------------------
21832:20131111:112759.467 server #1 started [configuration syncer]
21834:20131111:112759.476 server #2 started [poller]
21836:20131111:112759.477 server #4 started [poller]
21837:20131111:112759.477 server #5 started [poller]
21838:20131111:112759.478 server #6 started [poller]
21835:20131111:112759.478 server #3 started [poller]
21839:20131111:112759.482 server #7 started [unreachable poller]
21840:20131111:112759.482 server #8 started [trapper]
21848:20131111:112759.484 server #9 started [trapper]
21849:20131111:112759.486 server #10 started [trapper]
21852:20131111:112759.493 server #11 started [trapper]
21853:20131111:112759.494 server #12 started [trapper]
21854:20131111:112759.495 server #13 started [icmp pinger]
21855:20131111:112759.495 server #14 started [alerter]
21856:20131111:112759.501 server #15 started [housekeeper]
21856:20131111:112759.502 Executing housekeeper
21861:20131111:112759.503 server #16 started [timer] ←このプロセス
21862:20131111:112759.504 server #17 started [http poller]
21863:20131111:112759.504 server #18 started [discoverer]
21864:20131111:112759.505 server #19 started [history syncer]
21871:20131111:112759.513 server #21 started [history syncer]
21872:20131111:112759.520 server #22 started [history syncer]
21870:20131111:112759.521 server #20 started [history syncer]
21875:20131111:112759.522 server #24 started [proxy poller]
21827:20131111:112759.523 server #0 started [db watchdog]
21876:20131111:112759.528 server #25 started [self-monitoring]
21874:20131111:112759.533 server #23 started [escalator]
-------------------------------------------------
ps aux 結果
-------------------------------------------------
zabbix 21827 0.0 0.0 123768 2344 ? SN Nov11 0:00 /usr/local/zabbix/sbin/zabbix_server
zabbix 21832 0.0 0.0 123768 2640 ? SN Nov11 0:12 /usr/local/zabbix/sbin/zabbix_server
zabbix 21834 0.0 0.1 126112 11212 ? SN Nov11 0:30 /usr/local/zabbix/sbin/zabbix_server
zabbix 21835 0.0 0.1 126112 11244 ? SN Nov11 0:31 /usr/local/zabbix/sbin/zabbix_server
zabbix 21836 0.0 0.1 126112 11208 ? SN Nov11 0:32 /usr/local/zabbix/sbin/zabbix_server
zabbix 21837 0.0 0.1 126112 11264 ? SN Nov11 0:31 /usr/local/zabbix/sbin/zabbix_server
zabbix 21838 0.0 0.1 126112 11260 ? SN Nov11 0:31 /usr/local/zabbix/sbin/zabbix_server
zabbix 21839 0.0 0.0 126060 2884 ? SN Nov11 0:00 /usr/local/zabbix/sbin/zabbix_server
zabbix 21840 0.0 0.0 124100 2624 ? SN Nov11 0:04 /usr/local/zabbix/sbin/zabbix_server
zabbix 21848 0.0 0.0 124100 2600 ? SN Nov11 0:05 /usr/local/zabbix/sbin/zabbix_server
zabbix 21849 0.0 0.0 124100 2592 ? SN Nov11 0:04 /usr/local/zabbix/sbin/zabbix_server
zabbix 21852 0.0 0.0 124100 2604 ? SN Nov11 0:04 /usr/local/zabbix/sbin/zabbix_server
zabbix 21853 0.0 0.0 124100 2600 ? SN Nov11 0:04 /usr/local/zabbix/sbin/zabbix_server
zabbix 21854 0.0 0.1 124300 10560 ? SN Nov11 1:00 /usr/local/zabbix/sbin/zabbix_server
zabbix 21855 0.0 0.0 123768 1716 ? SN Nov11 0:00 /usr/local/zabbix/sbin/zabbix_server
zabbix 21856 0.0 0.0 123768 1732 ? SN Nov11 1:04 /usr/local/zabbix/sbin/zabbix_server
zabbix 21861 0.2 1.7 258512 137140 ? SN Nov11 3:59 /usr/local/zabbix/sbin/zabbix_server ←このプロセス
zabbix 21862 0.1 0.1 136668 14480 ? SN Nov11 1:48 /usr/local/zabbix/sbin/zabbix_server
zabbix 21863 0.0 0.0 123768 1612 ? SN Nov11 0:00 /usr/local/zabbix/sbin/zabbix_server
zabbix 21864 0.0 0.1 123768 10244 ? SN Nov11 0:12 /usr/local/zabbix/sbin/zabbix_server
zabbix 21870 0.0 0.1 123768 10236 ? SN Nov11 0:13 /usr/local/zabbix/sbin/zabbix_server
zabbix 21871 0.0 0.1 123840 10476 ? SN Nov11 0:13 /usr/local/zabbix/sbin/zabbix_server
zabbix 21872 0.0 0.1 123768 10236 ? SN Nov11 0:13 /usr/local/zabbix/sbin/zabbix_server
zabbix 21874 0.0 0.0 123804 1924 ? SN Nov11 0:03 /usr/local/zabbix/sbin/zabbix_server
zabbix 21875 0.0 0.0 123768 1624 ? SN Nov11 0:01 /usr/local/zabbix/sbin/zabbix_server
zabbix 21876 0.0 0.0 123768 1388 ? SN Nov11 0:04 /usr/local/zabbix/sbin/zabbix_server
-------------------------------------------------
TNK - 投稿数: 4769
リリースノートなどを確認してみましたが、1.8系において1.8.5以
降でtimerプロセスに関するメモリリークの修正という直接的な修
正内容の記載は見当たりませんでした。
しかし、1.8.5以降、致命的な脆弱性に対する修正や、メモリ利用
方法の大幅な改善が複数回行われていますので、より新しいバージ
ョンへの更新をお勧めします。
主に、各アイテムの値の取得タイミングを定期的に確認して、取得
タイミングであれば取得すべきアイテムの一覧をデータベースから
検索して、各値の取得処理をPollerプロセスに実施させるためのプ
ロセスです。
他の定期的に実行するものに関しても、このプロセスからの信号が
きっかけで処理を行うようになっていたと思います。
全く関係ないとは言い切れません。
少量のメモリ利用量増加であれば、そのタイミングで取得すべきア
イテム数がキューに溜まってしまっているものも合わせて増加する
状況が発生していたりすると、一時的に使用量が増加する可能性は
考えられると思います。
しかし、現在利用されているのが1.8.5とかなり古いので、リリー
スノートに明記されていなくとも、新しいバージョンに更新するこ
とで改善するかもしれません。
メンテナンス期間のホストに対するアイテムがキューに入る件に関
しては、他の方からも質問があったと思うので、検証環境を作成し
て検証することを検討中です。
moritake - 投稿数: 10
timerプロセスの役割について把握できました。
ありがとうございます。
メンテナンス期間のホストのアイテムがキューに入る件も
関係する可能性があるとの事了承いたしました。
いずれにしても、ご指摘の通り
かなり古いバージョンを利用してるのと
他にも不具合が散見しているため
本格的にバージョンアップを検討いたします。
ご回答頂きありがとうござました。