トリガーのステータス変更が行われない事象について
お世話になります。長文で失礼します。
トリガーのステータス変更が行われない事象に遭遇したため、原因の調査を行っております。
なお、現在はZabbixAgentの再起動により改善しております。
-----------------------------------------------------------------------------------------------------------------------------------
■使用バージョン
WindowsホストのOS:Windows Server 2019
Zabbixエージェント:zabbix_agentd Win64 (service) (Zabbix) 3.0.10
Revision 70200 14 July 2017, compilation time: Jul 14 2017 15:20:29
ZabbixプロキシのOS:Linux(Redhat 8.9)
Zabbixプロキシ:zabbix_proxy (Zabbix) 5.0.40
Revision 8856587278e 30 November 2023, compilation time: Nov 30 2023 10:43:29
ZabbixサーバのOS:Linux(Red Hat 8.3)
Zabbixサーバ:zabbix_server (Zabbix) 5.0.10
Revision 7c3f43904c 29 March 2021, compilation time: Mar 29 2021 13:09:37
■zabbix_agentd.confの内容
LogFile=C:\Program Files\zabbix\zabbix_agentd.log
Server=10.69.10.112 <- ZabbixプロキシサーバのIPアドレス
ServerActive=10.69.10.112 <- ZabbixプロキシサーバのIPアドレス
HostnameItem=system.hostname[host]
■zabbix_agentd.logの内容取得(直近30レコード) ※サーバ名部分はxxxxxxxxxxxに変更しております。
1848:20240327:161221.317 Zabbix Agent stopped. Zabbix 3.0.10 (revision 70200).
13808:20240327:161221.676 Starting Zabbix Agent [xxxxxxxxxxx]. Zabbix 3.0.10 (revision 70200).
13808:20240327:161221.676 **** Enabled features ****
13808:20240327:161221.676 IPv6 support: YES
13808:20240327:161221.676 TLS support: NO
13808:20240327:161221.676 **************************
13808:20240327:161221.676 using configuration file: C:\Program Files\zabbix\zabbix_agentd.conf
13808:20240327:161221.676 agent #0 started [main process]
11032:20240327:161221.676 agent #1 started [collector]
8820:20240327:161221.676 agent #2 started [listener #1]
3524:20240327:161221.676 agent #5 started [active checks #1]
3856:20240327:161221.676 agent #3 started [listener #2]
14504:20240327:161221.676 agent #4 started [listener #3]
3524:20240425:140738.751 active check data upload to [10.69.10.112:10051] started to fail ([connect] cannot connect to [[10.69.10.112]:10051]: (null))
3524:20240425:140738.876 active check data upload to [10.69.10.112:10051] is working again
3524:20240429:211121.217 active check configuration update from [10.69.10.112:10051] started to fail (ZBX_TCP_READ() timed out)
3524:20240429:211221.420 active check configuration update from [10.69.10.112:10051] is working again
16064:20240523:205021.723 Zabbix Agent stopped. Zabbix 3.0.10 (revision 70200).
6048:20240523:205022.051 Starting Zabbix Agent [xxxxxxxxxxx]. Zabbix 3.0.10 (revision 70200).
6048:20240523:205022.051 **** Enabled features ****
6048:20240523:205022.051 IPv6 support: YES
6048:20240523:205022.051 TLS support: NO
6048:20240523:205022.051 **************************
6048:20240523:205022.051 using configuration file: C:\Program Files\zabbix\zabbix_agentd.conf
6048:20240523:205022.051 agent #0 started [main process]
14972:20240523:205022.051 agent #1 started [collector]
16228:20240523:205022.051 agent #2 started [listener #1]
6532:20240523:205022.051 agent #3 started [listener #2]
6172:20240523:205022.051 agent #5 started [active checks #1]
16828:20240523:205022.051 agent #4 started [listener #3]
■アイテムのキー
log[E:\home5\log\FlowService.log,【連携エラー】,SHIFT_JIS]
■トリガーの条件式 ※サーバ名部分はxxxxxxxxxxxに変更しております。アイテムのキーにて絞り込み済みの文字列をiregexpしている点は、改善予定となります。
{xxxxxxxxxxx:log[E:\home5\log\FlowService.log,【連携エラー】,SHIFT_JIS].iregexp(【連携エラー】)}=1 and {xxxxxxxxxxx:log[E:\home5\log\FlowService.log,【連携エラー】,SHIFT_JIS].nodata(60)}=0
-----------------------------------------------------------------------------------------------------------------------------------
事象の詳細としましては、アイテムのヒストリに記録されているトリガー条件式に合致するレコードについて、
当該日時にステータスが障害とならなかったものとなります。
本事象の発生時期は絞り込みめておりませんが、2024年4月以降より発生し始めた認識です。
zabbix_agentd.logにあります通り2024年5月23日にZabbixAgentを再起動することで、
以降のアイテムのヒストリに記録されているトリガー条件式に合致するレコードについて、
障害ステータスへの変更が行われるようになったことを確認しております。
本件と似たような経験をお持ちの方がいらっしゃいましたら、原因調査のアドバイスを頂ければ幸いです。
また、現在のログでは特段本事象の起因となるエラーが確認できなかった為、再発に備え、ログレベルの変更も検討しております。