zabbix-serverサービス停止
AWSにてZabbixサーバを構築し監視を行っているのですが、ここ数日前から突然zabbix-serverのサービスが停止し、監視できていない状況が多発するようになりました。
zabbix_server.logには停止時のログは下記の通りです。
*********************************************************************
syncing history data done
syncing trends data...
syncing trends data done
Zabbix Server stopped. Zabbix 2.4.8 (revision 59539).
*********************************************************************
調査を進めておりますが原因を全くつかめず(ログには残っていない。)原因かどうか不明ですが、唯一見つけた情報が下記のエラーとなります。
*********************************************************************
kernel: [387682.644858] zabbix-agent[6182]: segfault at 63 ip 00007fa7e79b967d sp 00007fa7e83cf4e0 error 4 in libnss_files-2.17.so[7fa7e79b6000+c000]
*********************************************************************
【構成】
Amazon Linux
zabbix 2.4.8
原因調査方法・改善方法等ご助力いただければ幸いです。
TNK - 投稿数: 4742
記載いただいた情報だけでは判断できません。
Zabbixのログだけではなく、OSのログも確認してみてください。
OSの更新はこまめに行われていますか?
あと、Amazon Linuxとのことですが、Zabbixのインストールはどの
ようにして行われましたか?
RHEL 6用のパッケージを使用されていませんか?
何らかの問題があったとしても、Zabbix 2.4.8のサポートは終了し
てしまっているので、不具合の修正が行われてリリースされること
はないでしょう。
新しいバージョンで、かつOSにより適した実行ファイルを使用する
ことが必要かもしれません。
msy - 投稿数: 24
インストールした当時下記rpmにてインストールをしています。
確かにRHEL 6用のパッケージを使用しております。
http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm
OSの更新もこまめに行っておりませんでした。
現状最新のzabbixへのバージョンアップも視野に入れていますが、
原因が特定できていない為、最新に入れ替えても発生するのではないかと、
若干しこりの残る状態です。
TNK - 投稿数: 4742
もう少し何らかのログが残っているはずです。
例えば、何らかの要因で負荷が上昇したりプロセスのbusy状態が発
生してOOM Killerにプロセスをkillされたりしたのかもしれません。
そうならば、OSのログにその旨が出力されているはずです。
プロセスが異常終了すれば、どのプロセスが異常終了したかZabbix
のログにも残るはずです。
現時点の状態で、原因を探りたいのであれば、もう少し細かく調べ
てみてください。
msy - 投稿数: 24
回答ありがとうございます。
もう一度ログの内容を洗ってみます。