Zabbix-serverが停止に失敗する

お世話になります。

Zabbix-serverをLinux上でSystemctl stop zabbix-serverすると動作が止まったまま停止しません。
KillmodeをKillMode=control-group からmixdにしたら一部止まるようにはなったのですが
Pacemaker上ではFaild扱いになる止まり方みたいです。

監視対象と監視項目の追加、IP変更を先週行っております。
それまではなんの問題もなく起動停止できておりました。

どうしたらうまくZabbixがきれいに停止できるかご教授お願いします。
(起動についてはなんの問題もありません。)

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー fripper の写真

監視対象のホスト数・アイテム数等にもよりますが、規模の大きな監視を行う場合
zabbix_server の起動・終了時に、そこそこの時間を要します
(キャッシュの掃き出し・ディスク・DB等との同期などにより)

手元環境ですと、4-5分程度要することもある感じです

現状の監視規模で、どの程度の時間を設定すべきなのか、については、I/O 性能等にもよるので
一概に言うことはできませんが‥

zabbix-server.service の unit 設定を追加・編集して
https://qiita.com/JhonnyBravo/items/a28074c20fa9adf02be3#timeoutstartsec
TimeoutStartSec / TimeoutStopSec 等
もしくは、1つにまとめて TimeoutSec 設定値を指定してみるのはいかがでしょうか?

デフォルトですと、90sec 程度がしきい値だったかと思いますので
systemd による起動・停止処理時に、90sec 以内に処理が完了しないと
強制的に kill されるなどが発生し、悪い場合にはデータの破損などを
引き起こすことにも繋がります

ユーザー nmyyn の写真

素早いご解答ありがとうございます。

>手元環境ですと、4-5分程度要することもある感じです
→やっぱり時間がかかるものなんですね。

>zabbix-server.service の unit 設定を追加・編集して
>https://qiita.com/JhonnyBravo/items/a28074c20fa9adf02be3#timeoutstartsec
>TimeoutStartSec / TimeoutStopSec 等
>もしくは、1つにまとめて TimeoutSec 設定値を指定してみるのはいかがでしょうか?
→ありがとうございます。試してみます。

現在バックエンドDBがPostgresSQLでNFSの共有ディスク上にあるため
余計に停止に時間がかかっているのかもしれません。。

ユーザー nmyyn の写真

お世話になっております。

TimeoutSec設定値を240秒に設定し、
それに合わせてPacemaker側のtimeout時間を300から900に修正したら
無事にZabbixの停止が完了しました。

ありがとうございました。