HA復旧後のエラーログ

お世話になっております。

 Zabbix Server/Proxy/Agent 6.0
 zabbix 6.0 native HA
 mariadb galera 4
 RockyLinux8

ZabbixServer6.0 3台のHA構成を組んでいます。
HA検証で、Active機のzabbix-serverサービスを停止させてから復旧させるため、
下記の手順を実施しました。

【ホスト名(仮):zs-active】
# systemctl stop zabbix-server
Active機が切り替わり、監視が継続できていることを確認
# vi /etc/zabbix/zabbix_server.conf
HANodeName=zs-active
NodeAddress=zs-activeのIPアドレス

#HANodeName=zs-active
#NodeAddress=zs-activeのIPアドレス
# systemctl start zabbix-server
監視開始していない
# vi /etc/zabbix/zabbix_server.conf
#HANodeName=zs-active
#NodeAddress=zs-activeのIPアドレス

HANodeName=zs-active
NodeAddress=zs-activeのIPアドレス
# systemctl start zabbix-server
Standby機として起動。HAに復帰していることを確認。
zabbix_server.logでもstandbyで起動したことを確認した。

30分~40分後
zabbix_server.logで下記のログが出力される。

694877:20220512:111325.292 [Z3005] query failed: [1180] Got error 6 "No such device or address" during COMMIT [commit;]
694877:20220512:111325.292 HA manager has been paused
694876:20220512:111325.292 HA manager error: database error
694877:20220512:111325.293 HA manager has been stopped
694876:20220512:111325.302 Zabbix Server stopped. Zabbix 6.0.3 (revision 506e2b51e2).

このログの後、下記のログが10秒おきに計5回出力される。

694957:20220512:111335.488 Starting Zabbix Server. Zabbix 6.0.3 (revision 506e2b51e2).
694957:20220512:111335.488 ****** Enabled features ******
694957:20220512:111335.488 SNMP monitoring: YES
694957:20220512:111335.488 IPMI monitoring: YES
694957:20220512:111335.488 Web monitoring: YES
694957:20220512:111335.488 VMware monitoring: YES
694957:20220512:111335.488 SMTP authentication: YES
694957:20220512:111335.488 ODBC: YES
694957:20220512:111335.488 SSH support: YES
694957:20220512:111335.488 IPv6 support: YES
694957:20220512:111335.488 TLS support: YES
694957:20220512:111335.488 ******************************
694957:20220512:111335.488 using configuration file: /etc/zabbix/zabbix_server.conf
694957:20220512:111335.518 current database version (mandatory/optional): 06000000/06000000
694957:20220512:111335.518 required mandatory version: 06000000
694958:20220512:111335.525 starting HA manager
694957:20220512:111335.527 cannot start server: found standby duplicate "zs-active" node
694958:20220512:111335.528 HA manager has been stopped
694957:20220512:111335.530 Zabbix Server stopped. Zabbix 6.0.3 (revision 506e2b51e2).

その後、下記のログが出力され、それ以降はログ出力がありません。
監視も正常に行われています。

694997:20220512:111426.723 Starting Zabbix Server. Zabbix 6.0.3 (revision 506e2b51e2).
694997:20220512:111426.723 ****** Enabled features ******
694997:20220512:111426.723 SNMP monitoring: YES
694997:20220512:111426.723 IPMI monitoring: YES
694997:20220512:111426.723 Web monitoring: YES
694997:20220512:111426.723 VMware monitoring: YES
694997:20220512:111426.723 SMTP authentication: YES
694997:20220512:111426.723 ODBC: YES
694997:20220512:111426.723 SSH support: YES
694997:20220512:111426.723 IPv6 support: YES
694997:20220512:111426.723 TLS support: YES
694997:20220512:111426.723 ******************************
694997:20220512:111426.723 using configuration file: /etc/zabbix/zabbix_server.conf
694997:20220512:111426.745 current database version (mandatory/optional): 06000000/06000000
694997:20220512:111426.745 required mandatory version: 06000000
694998:20220512:111426.754 starting HA manager
694998:20220512:111426.759 HA manager started in standby mode
694997:20220512:111426.759 "zs-active" node started in "standby" mode

このログは、今後も出力されるものでしょうか?
それとも、スタンバイに復帰した直後であったために出力されたのでしょうか?
[Z3005] query failed: [1180] Got error 6 "No such device or address" during COMMIT [commit;] 
がDBのエラー?というところまでしか分からず。。
cannot start server: found standby duplicate "zs-active" node
については情報が見つかりませんでした。
同様の事例をご存知の方がいらっしゃればご教示いただけますと幸いです。

以上、よろしくお願いいたします。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー minayan の写真

ha_manager.cのソースコードを確認してみました。
HAノードのserverの場合、サービス起動されると自身がAcitive Nodeかどうか5回チェックするようになっています。
自分のところにHA構成が無いため、実際の確認ができませんが、サービス起動時のみのチェックなので以降はログに出ないと思われます。
サーバー再起動したり、サービス再起動した場合は、再度チェックが走りますが、上記の動作かと思います。
他のActiveノードが停止して、自身がActiveノードになった場合も同じようなログが出ます。

ユーザー tototo の写真

30分~40分後
zabbix_server.logで下記のログが出力される。

694877:20220512:111325.292 [Z3005] query failed: [1180] Got error 6 "No such device or address" during COMMIT [commit;]
694877:20220512:111325.292 HA manager has been paused
694876:20220512:111325.292 HA manager error: database error
694877:20220512:111325.293 HA manager has been stopped
694876:20220512:111325.302 Zabbix Server stopped. Zabbix 6.0.3 (revision 506e2b51e2).

こちらのログについては何かご存知でしょうか?
本日もこのログが出力されてから5回チェックが入りました、、、

ユーザー tototo の写真

ソースコードを確認していただきありがとうございます。
それ以降ログは出ていなかったため、minayanさんのおっしゃる通りかと思います。
ご回答いただきありがとうございました。
大変助かりました。