Zabbix database is downが発生する原因、対策について
<事象>
Zabbixエージェント側のサーバより、「Zabbix database is down」というメッセージ通知がきたため、以下ログを確認しましたが、
直接的な原因となりそうなメッセージを見つけられませんでした。
・zabbix_agentd.log → メッセージ出力なし
・zabbix_server.log → DBへのコネクトが失敗したが、再接続されたメッセージあり
・mySQL.log → データベースのリスタート、リカバリ開始メッセージあり
尚、zabbix_server.logでは「Zabbix database is down」メッセージ出力以前に、「slow query」メッセージが多発していました。
あくまで推測ですが、slow query が多発し、データベース側のコネクションを食いつぶした可能性もあるのではと考えております。
2237:20170306:100454.576 slow query: 3.506163 sec, "select distinct t.triggerid,t.description,t.expression,t.status,t.type,t.priority,t.comments,t.url from triggers t,functions f,items i,item_discovery id where t.triggerid=f.triggerid and f.itemid=i.itemid and i.itemid=id.itemid and id.parent_itemid=23868"
<聞きたいこと>
・類似事象があり、対処した例があれば、原因/対処方法ご教示頂けないでしょうか。
・他に確認すべきログ等があればご教示頂けないでしょうか。
<環境>
・Zabbixバージョンは3.0.5
・Zabbixマネージャサーバ
Red Hat Enterprise Linux Server release 7.2 (Maipo)
AWS
・Zabbix Agentサーバ
Windows2012 R2
Azure
TNK - 投稿数: 4671
処理性能が低いサーバーを使用していると、たまに発生してしまう
場合があると思います。
使用されているMySQLのバージョンがわかりませんが、チューニン
グはされていますか?
使用されているDBMSによっては、デフォルトのメモリの割り当てが
不適切で、サーバー自体のメモリサイズが大きくてもDBMSに有効に
割り当てられていない場合があります。
チューニングをされていないのであれば、一度、チューニングを試
してみてはいかがでしょうか?