Zabbix agent on xxxx is unreachable for 10 minutesの発生について
いつもお世話になっております。
特定のホストのZabbix Agentにおいて障害が発生します。
<環境>
Zabbix Server→Version 2.0.8 (CentOS 6.4)
Zabbix Agent →Version 2.0.18 (WindowsServer2008R2)
<障害内容>
決まった時間から「Zabbix agent on xxxx is unreachable for 10 minutes」が障害と復旧を繰り返します。Windows側でZabbix Agentのサービスを停止しても、プロセスにZabbix_Agentd.exeが残ったままとなり、taskkill /Fでも強制終了できない状態です。OS再起動すると正常に戻りますが、数日後に再発します。
Zabbix Agentのログを確認すると
「 PERF_COUNTER(): call to PdhOpenQuery() failed: [0x00000102] unable to find message text: [0x0000013D] メッセージ番号 0x%1 のメッセージ文が %2 のメッセージ ファイルに見つかりません。」
が大量に出力されていました。
決まった時間、とはスケジュールバックアップですので、まずはバックアップジョブを停止する予定ではありますが、上記ログから特定できる下人や対策について情報ございましたら共有いただけますと幸いです。よろしくお願いいたします。
Yasumi - 投稿数: 380
英語の外部サイトですが、下記に該当している可能性はありそうです。
https://support.zabbix.com/browse/ZBX-4156
デバックレベルを上げてログを確認してみてください。ただ、
根本的にはZabbixサーバ・エージェントのバージョンアップが推奨されるでしょう。
itou - 投稿数: 18
コメントありがとうございます。デバッグレベルを上げてみます。
TNK - 投稿数: 4744
Zabbixのエージェントが2.0.18と古いバージョンを使用されている
ようですので、2.0系の最新のバージョン2.0.21で改善されるかも
しれません。
ただし、Zabbix 2.0は、2017年05月にサポートが終了していますの
で、Zabbixの不具合であったとしても修正されて一般に公開される
ことはありません。
より新しいバージョンへのバージョンアップもご検討ください。
また、Zabbixエージェントのログに大量に出力されていたメッセー
ジに関しては、対象のイベントログを出力したアプリケーションが、
エラーメッセージをきちんと登録していないために発生しているエ
ラーだと思われます。
これは、Zabbix側では改善できませんので、対象のイベントログを
出力しているアプリケーションの開発者もしくはベンダにお問い合
わせください。
itou - 投稿数: 18
コメントありがとうございます。Agentを2.0.21へバージョンアップしてみます。
itou - 投稿数: 18
コメントありがとうございます。Agentを2.0.21へバージョンアップしてみます。
itou - 投稿数: 18
2.0.21は「unsupported versions」という扱いだと思いますが。こちらはどのような意味合いなのでしょうか。
TNK - 投稿数: 4744
先の回答でも書かせて頂いたとおり、Zabbix 2.0は、2017年05月に
すでにサポートが終了しているバージョンであるということです。
不具合があっても修正はされません。
itou - 投稿数: 18
コメントありがとうございます。デバッグレベルを上げてみます。