Zabbix 2.1.4 がクラッシュします

Debian sid で zabbix 2.1.4 の独自パッケージを作成してインストールしていますが、zabbix-server 起動後 数分から数時間後に下記のようなメッセージを出力して、zabbix-server が停止するということが頻発しています。
※ログの全文は、添付します。

29955:20130906:222936.422 Got signal [signal:11(SIGSEGV),reason:1,refaddr:(nil)]. Crashing ...

過去にも、フォーラムで同様の事象が発生した事例が出ていましたが、それらは1.8.xでの話でした。
こういったバグ報告?は、やはり本家の方にしたほうが良いでしょうか。

ログの最後にある、objdump コマンドを実行して、ダンプデータも取得してあります。

29955:20130906:222936.522 ================================
29955:20130906:222936.522 Please consider attaching a disassembly listing to your bug report.
29955:20130906:222936.522 This listing can be produced with, e.g., objdump -DSswx zabbix_server.
29955:20130906:222936.522 ================================

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

人違いであったら申し訳ないのですが、Soukakuさんは、2.1系の前のバージョンでも
異常終了してしまうとTwitterでつぶやかれてませんでしたでしょうか?

記載頂いた情報からは、DBとの同期処理内でSIGSEGVが発生していると思われるの
ですが、このような異常終了の仕方をする場合、ライブラリやプロダクトのバージョン
での不一致や、利用されている値の内容などに依存して発生するのではないでしょうか?

利用されているOSがDebian sidとのことですので、もしかしたら、利用されている
各種パッケージやglibcなどのバージョンが新しすぎて、何らかの問題が発生している
のかもしれません。

OS自体が不安定版である場合に、本家に報告しても調査・対応して頂けるかわかり
ませんが、利用されている環境に関する情報をより詳しく提示することが必要になる
と思います。

例えば、

 ・kernelのバージョン
 ・リンクさせる各ライブラリやプロダクトのバージョン
   特に、glibc、MySQL
 ・Zabbixビルド時のconfigureオプション
 ・Zabbixに設定している内容

などはどのようになってますでしょうか?

ちなみに、CentOS 6.4上であれば、Zabbix 2.1.2でデフォルトで登録されている
Zabbix Serverの監視を有効にして連続稼働テストを行っても、1週間以上安定
して稼働できています。

ユーザー Soukaku の写真

えー、まさにつぶやいた本人です。

sid使っている時点で自己責任なのは十分承知なのですが、何か解決の手がかりがあればと思って、書き込んだ次第です。
詳細な情報を出したいのはやまやまなのですが、自宅のサーバで起きている事象なのと、仕事のほうが詰まっていているので、
落ち着いたところで、改めて状況等を制したいと思います。

ユーザー kodai の写真

トリガー関数の評価のところで落ちているように見えるのが少し気になります。

問題が再現できるようであればZabbix SIAのBTSで報告した方が良いのですが、どのような条件のときに発生するか何かヒントはないでしょうか?

もし可能であれば、zabbix_server.confのDebugLevelを4に設定し、起動してから落ちるまでのデバッグログを取得して頂けると助かります。

ユーザー Soukaku の写真

どのタイミングで発生しているのか、皆目検討がつかないのが正直なところです。
起動から数分て落ちるときもあれば、8時間ぐらい動作してから落ちるときもあるので。

事象自体は再現性が高く、DebugLevel 4 でログも取り続けている状況ですので、BTS に報告するための情報のほうは
容易に集められると思います。
ちょっと時間が取れない状況が続いていますので、落ち着き次第対応したいと思います。

ユーザー kodai の写真

クラッシュの再現性が高いようでしたらぜひデバッグ情報を頂きたいです。デバッグログとダンプがあれば、クラッシュの原因も特定できると思います。

ユーザー Soukaku の写真

文章はあやしいところがありますが、本家のBTSのほうに報告しました。

https://support.zabbix.com/browse/ZBX-7014

これが、なんらかのバグ解消のきっかけとなればよいのですが…。

ユーザー kodai の写真

ありがとうございます!

アップしていただいた添付の詳細はまだ確認できていないですが、2.2リリースまでには何かしらの対応が行われるはずですのでお待ち頂けますでしょうか。

ユーザー Soukaku の写真

ZBX-7014 は ZBX-6987 に統合されましたが、ZBX-6987 の方をチェックしていたら対策版がでたようです。
(自分がBTSに登録した時に、ZBX-6987 で同じような事象が報告されているのに気が付きました。)

https://support.zabbix.com/browse/ZBX-6987

早速、SVN から対策版のソースを入手して、インストールしてみましたが、今のところ問題なく動作を続けています。