大量アクション後にアクションが実行されなくなる
いつも大変お世話になっております。
s.shibanoです。
掲題の件につきまして、情報がありましたら、ご教示頂きたく
投稿させて頂きます。
環境
Zabbix_Server2.0.3 (src install)
MySQL5.5.27
PHP 5.1.6
Apache 2.2.3
2/28 の朝に障害が発生し、Ping監視、log監視にて継続トリガーとしていたため、
大量のメールが送信されました。
一人当たり3~4万通で大よそ20万通程度
(トリガーアクションとしては8万回程度 メール+リモートコマンドの為)
全てのアクションを吐き終わった後、アラートを検知した事を
イベント画面より詳細を確認しましたが、「該当のアクションはありません。」
となり、一切のアクションが実行されなくなってしまいました。
確認した内容としましては、
・Zabbixサーバにて、PHPにてメールを送信、受信できる事を確認
→対向メールサーバに拒否されていない事を確認
・アクション再作成、するが実行されない
・イベント、アクションログの削除を行いたく、[管理]-[一般設定]-[データの保存期間]を両方0日に変更し、
Zabbix_Server再起動を実施
・/var/log/zabbix/zabbix_server.log を確認
→Database is down. Retrying in 10 seconds が継続的に出力されている。
→MySQLプロセスを確認し、起動している事を確認、及びWebGUIにて設定変更できる事を確認
→tail -f にて見守っていると、下記のログが出力されておりました。
2302:20130305:111718.545 [Z3005] query failed: [2006] MySQL server has gone away [update escalations set status=0,esc_step=1,nextcheck=1362363502 where escalationid=27727315;
update escalations set status=0,esc_step=1,nextcheck=1362363502 where escalationid=27706716;
update escalations set status=0,esc_step=1,nextcheck=1362363503 where escalationid=27749556;
update escalations set status=2 where escalationid=11907639;
update escalations set status=0,esc_step=1,nextcheck=1362363503 where escalationid=27539243;
update escalations set status=0,esc_step=1,nextcheck=1362359992 where escalationid=27711963;
update escalations set status=0,esc_step=1,nextcheck=1362359992 where escalationid=27627040;
update escalations set status=0,esc_step=1,nextcheck=1362359995 where escalationid=27627311;
update escalations set status=0,esc_step=1,nextcheck=1362359997 where escalationid=27711334;
update escalations set status=0,esc_step=1,nextcheck=1362359998 where escalationid=27733220;
update escalations set status=0,esc_step=1,nextcheck=1362363535 where escalationid=27730356;
update escalations set status=0,esc_step=1,nextcheck=1362363721 where escalationid=27722166;
update escalations set status=0,esc_step=1,nextcheck=1362363721 where escalationid=27551949;
update escalations set status=0,esc_step=1,nextcheck=1362363722 where escalationid=27748367;
update escalations set status=0,esc_step=1,nextcheck=1362363863 where escalationid=27052847;
update escalations set status=0,esc_step=1,nextcheck=1362363879 where escalationid=27547423;
update escalations set status=0,esc_step=1,nextcheck=1362363879 where escalationid=27543507;
update escalations set status=0,esc_step=1,nextcheck=1362363886 where escalationid=27731088;
update escalations set status=0,esc_step=1,nextcheck=1362363890 where escalationid=27749638;
delete from escalations where (escalationid in ( ・・・
※ delete文については、長い為ID部分と思われる以降は「・・・」とさせて頂きました。
何か、アクションが実行されない理由はありますでしょうか。
または、確認すべき点が漏れているようでしたら、ご指摘頂けないでしょうか。
以上、よろしくお願い致します。