Zabbixサーバでの「Zabbixサーバーが動作していません(画面のリフレッシュを行ってステータスを再確認してください)」メッセージ、Windows・linuxログ監視アイテムのデータ取得不可対策について
お世話になります。
現在、Zabbix4.0で監視を行っているのですが、
Zabbixサーバ管理画面にて「Zabbixサーバーが動作していません(画面のリフレッシュを行ってステータスを再確認してください)」
とメッセージが出力され、「レポート」⇒「システム情報」のZabbixサーバーの起動が「いいえ」となってしまいます。
また、最新データにてZabbixエージェント(アクティブ)アイテムのWindows・linuxログ監視データが取得できていない事象も
発生しております。(「設定」⇒「ホスト」⇒「アイテム」設定画面にてエラー等は発生しておりません)
上記2点の事象を解決したいためこの度投稿させていただきました。
環境は以下となります。
【Zabbixサーバー】バージョン4.0.10
【Zabbixエージェント】4.0.21
【監視対象OS】RHEL6.6及びWindows Server 2012 R2 Standard
「Zabbixサーバーが動作していません(画面のリフレッシュを行ってステータスを再確認してください)」の対応としては
多くのサイトに載っているSElinuxの無効及び/etc/zabbix/web/zabbix.conf.phpの15行目「ZBX_SERVER」の
変更(localhost⇒127.0.0.1)をし、設定修正後Zabbixサーバのサービス再起動を実施いたしましたが
結果は変わらずメッセージが出力されてしまいます。OSの再起動は実施しておりません。
(サービス再起動後、一瞬だけZabbixサーバーの起動が「はい」となりましたがすぐに「いいえ」になります)
過去にZabbixサーバを何台か構築いたしましたが、どのサーバも当メッセージは出力されていないです。
過去のサーバと異なる点はZabbixエージェント(アクティブ)アイテムの数であり、過去は多くて35個程度で今回のサーバは66個と
多くなっています。
Zabbixエージェント(アクティブ)アイテムのデータ取得については、
Zabbixエージェントログにて「active check configuration update from [***.***.***.***:10051] started to fail
(ZBX_TCP_READ() timed out)」のメッセージが出力されておりました。
こちらはZabbixエージェント及びZabbixサーバの「Timeout」をデフォルトの3以上に上げる事が対策になる認識ですが、
他に調整するべき設定項目はありますでしょうか。
上記問題について解決する方法がございましたら、ご教示いただきたく存じます。
よろしくお願いいたします。
TNK - 投稿数: 4730
psコマンドなどで、プロセスが起動しているかを確認してください。
起動していない場合は、ログファイルに何か出力されていないか確
認してください。
Zabbixサーバーの処理負荷が高いとか、設置場所が離れていて、
ネットワークのスピードやレスポンスが遅いのであれば、タイムア
ウトの時間を伸ばすことで対応できますが、Firewallなどで通信が
制限されているような場合であれば、意味がありません。
Zabbixサーバーのプロセスが起動していない場合もタイムアウトが
発生するでしょう。
タイムアウトを伸ばしても改善しないようであれば、Zabbixサーバー
の起動とネットワークの設定を確認してください。
DSR-1 - 投稿数: 31
TNK様
お世話になっております。
ご返信が遅くなりました。
2点の問題について、情報いただきありがとうございます。
「Zabbixサーバーが動作していません(画面のリフレッシュを行ってステータスを再確認してください)」については
Zabbixサーバの設定「StartTrappers」の値を増やしZabbixサーバのサービスを再起動した結果、出力されなくなりました。
Zabbixエージェントのtimed outについては引き続きプロセス・ログ、ネットワーク設定の確認を行いながら対応を進めてまいります。
以上、よろしくお願いいたします。