HAのスタンバイ機がステータス「スタンバイ」と「利用不可」を行き来する。
お世話になっております。
zabbix 6.0 native HA (3台構成)
mariadb galera cluster
Webサイトで更新ボタンを押すと、
スタンバイ機1台のステータスが「スタンバイ」と「利用不可」を行き来します。
下記の通り情報収集しました。
いろいろ調べてみたところ、Mariadbのチューニングが必要とありました。
下記の情報だけでそう判断して問題ないでしょうか。
他に見るべき箇所があればご教示いただけますと幸いです。
===障害が発生しているスタンバイ機1台で以下を確認。======================
●zabbix_server.log
180636:20220710:155432.250 "ホスト名" node is working in "standby" mode
180637:20220710:160022.789 [Z3005] query failed: [1213] Deadlock found when trying to get lock; try restarting
180636:20220710:165432.250 "ホスト名" node is working in "standby" mode
180636:20220710:175432.249 "ホスト名" node is working in "standby" mode
(以下エラーログ無し。)
●Webサイトの状態
3台とも監視情報を確認できる。
●Ping可
●Mariadbにエラーログ出力無し
●systemctl restart zabbix-serverしたが変化なし。
===ここまで。===================================================
fripper - 投稿数: 495
クラスタ構成のサーバ3台で時刻がずれているとか無いでしょうか
提示いただいたログの記録時刻が前後しているように見受けられます
tototo - 投稿数: 94
ご返信いただきありがとうございます。
各サーバの時刻を確認してみました。
2022年 7月 14日 木曜日 10:51:08 JST
2022年 7月 14日 木曜日 10:50:49 JST
2022年 7月 14日 木曜日 10:50:10 JST
特に大きな差はありませんでした。
時刻の差によるものではないと思われます。
ログについてですが、
障害が発生しているサーバから抜き出したものになります。
分かりづらく、申し訳ございません。
TNK - 投稿数: 4769
同じタイミングで取得されたのであれば、大きな差です。
きちんとNTPなどを使用してサーバーの時刻同期を行うようにして
ください。
tototo - 投稿数: 94
ご返信いただきありがとうございます。
時刻同期をしたところ、
スタンバイ状態が維持されるようになりました。
1カ月ほど問題なく動いていたので、
時刻がずれていたことが原因だとは思いませんでした。。。
大変勉強になりました。
お二人ともご助力いただきありがとうございました。