アクションが実行されないことがある

お世話になります。

AWS環境に構築したZabbixで障害検知時のアクションを設定しているのですが、
同一トリガー、同一アクション内容なのに、アクションが実行される場合と
されない場合があり原因がわからず困っています。

障害イベントが単一、複数に関わらず実行されたりされなかったりし、複数発報
した場合は、最初の1件だけ抜けたり、途中からアクション実行されなくなったりと
規則性も見出せません。

なお実行されない場合はステータスが失敗になる等ではなく、アクションの履歴すら
ない状態です。
このような状態について、なにか原因として思い当たることはないでしょうか。
ご教示のほどよろしくお願いします。

【Zabbixサーバ情報】
OS:Amazon Linux release 2
Zabbixサーバ:4.0.20

【アクションの内容】
実行条件:メンテナンス期間外 and トリガーの深刻度が情報以上
実行内容:現在のホストでリモートコマンドを実行(別サーバへのSyslog転送スクリプト)

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

アクションの履歴に残っていないのであれば、正しくトリガーイベ
ントが発生していないと思われます。

トリガーの設定の見直しと、別の障害が発生していないかZabbixサ
ーバーのログを確認してください。

-- 追記 --
イベントリストにも記録は残っていないのですか?

ユーザー taq の写真

TNKさん

ご回答ありがとうございます。
はい、イベントリストにも記録が残っていません。

こちらデバッグモードにて事象を再現させ、Zabbixサーバログを
確認したところescalationsプロセスの処理が動いていないように
見受けられました。

以下にアクション実行時と未実行時のZabbixサーバログを転記します。

なお、実行時、未実行時ともにescalationsテーブルにレコードが一瞬
登録されたことは確認しており、各カラムにも差異はないように見えます。

=============アクション実行時=================
27881:20200902:101824.060 __zbx_zbx_setproctitle() title:'escalator #1 [processed 0 escalations in 0.003966 sec, processing escalations]'
27881:20200902:101824.060 In process_escalations()
27881:20200902:101824.061 query [txnlev:0] [select escalationid,actionid,triggerid,eventid,r_eventid,nextcheck,esc_step,status,itemid,acknowledgeid from escalations where triggerid is not null and nextcheck<=1599009507 order by actionid,triggerid,itemid,escalationid]
27881:20200902:101824.062 query [txnlev:0] [select actionid,name,status,eventsource,esc_period,def_shortdata,def_longdata,r_shortdata,r_longdata,pause_suppressed,ack_shortdata,ack_longdata from actions where actionid=7 order by actionid]
27881:20200902:101824.062 In substitute_simple_macros() data:'1m'
27881:20200902:101824.062 query [txnlev:0] [select actionid from operations where recovery=1 and actionid=7]
27881:20200902:101824.062 query [txnlev:0] [select eventid,source,object,objectid,clock,value,acknowledged,ns,name,severity from events where eventid=10363 order by eventid]
27881:20200902:101824.063 query [txnlev:0] [select distinct eventid from event_suppress where eventid=10363]
27881:20200902:101824.063 query [txnlev:0] [select eventid,tag,value from event_tag where eventid=10363 order by eventid]
27881:20200902:101824.064 query [txnlev:0] [select triggerid,description,expression,priority,comments,url,recovery_expression,recovery_mode,value from triggers where triggerid=16400]
27881:20200902:101824.064 In check_escalation() escalationid:849 status:active
27881:20200902:101824.064 End of check_escalation():process error:''
27881:20200902:101824.064 In escalation_execute() escalationid:849 status:active
・・・以下省略・・・
============================================

============アクション未実行時=================
27881:20200902:101836.164 __zbx_zbx_setproctitle() title:'escalator #1 [processed 0 escalations in 0.005532 sec, processing escalations]'
27881:20200902:101836.164 In process_escalations()
27881:20200902:101836.165 query [txnlev:0] [select escalationid,actionid,triggerid,eventid,r_eventid,nextcheck,esc_step,status,itemid,acknowledgeid from escalations where triggerid is not null and nextcheck<=1599009519 order by actionid,triggerid,itemid,escalationid]
27881:20200902:101836.166 End of process_escalations()
27881:20200902:101836.166 In process_escalations()
27881:20200902:101836.167 query [txnlev:0] [select escalationid,actionid,triggerid,eventid,r_eventid,nextcheck,esc_step,status,itemid,acknowledgeid from escalations where triggerid is null and itemid is not null and nextcheck<=1599009519 order by actionid,triggerid,itemid,escalationid]
27881:20200902:101836.167 End of process_escalations()
27881:20200902:101836.167 In process_escalations()
27881:20200902:101836.168 query [txnlev:0] [select escalationid,actionid,triggerid,eventid,r_eventid,nextcheck,esc_step,status,itemid,acknowledgeid from escalations where triggerid is null and itemid is null and nextcheck<=1599009519 order by actionid,triggerid,itemid,escalationid]
27881:20200902:101836.168 End of process_escalations()
27881:20200902:101836.168 __zbx_zbx_setproctitle() title:'escalator #1 [processed 0 escalations in 0.004635 sec, idle 3 sec]'
============================================