タイムアウト値を変更する際の注意点について
取得不可状態となるアイテムを監視していて、タイムアウトの影響で頻繁に検知をすることがわかりました。
対策としてzabbix-serverとzabbix-agentのタイムアウト値を3秒から30秒に変更したいと考えています。
そこで確認なのですがタイムアウト値を変更した際の注意点等ありますでしょうか?
監視の遅延など考えられる事象があればご教示お願いいたします。
-------------サーバー情報-------------
zabbixバージョン2.4.7(3.0.4にバージョンアップ検討中)
サーバーOSCentOS release 6.7 (Final)
----------------------------------------------------
fripper - 投稿数: 495
zabbix_server.conf 側の Timeout パラメータは「Zabbixエージェント」タイプのアイテムをはじめ、
SNMPチェック、シンプルチェック等、zabbix_server モジュールが、ポーリング実施によって
監視結果を収集してくる項目に関するタイムアウト値に影響します
zabbix_agentd.conf 側の Timeout パラメータは、UserPatameterを中心に、
「Zabbixエージェント」タイプ、「Zabbixエージェント(アクティブ)」をはじめ
zabbix_agentd モジュールがコマンド実行の結果によって監視結果を収集してくる項目に
関するタイムアウト値に影響します
「取得不可」となっている項目の監視収集方法・設定から、どちらのパラメータを
設定変更すべきなのか、両方を設定変更すべきなのか、は異なるので、十分に確認をお願いします
タイムアウト値を変更した際の注意点ですが‥
zabbix_server側の poller プロセスが、今まで3秒で諦めていたところを30秒まで待つように
なりますので、待たされる頻度が高い場合には、プロセスのビジー率が上がってしまい
他の監視収集項目も含め、収集が遅延する可能性があります
サーバプロセスのビジー率が高くなるようであれば、Pollerプロセスの動作数を増やして
タイムアウト待機数が多くなっても円滑に監視が回るようにするなど、したほうが良いでしょう
TNK - 投稿数: 4760
少しだけ補足させて頂きます。
一番発生しやすい問題は、アイテムの値取得の処理がキューに溜ま
ってしまって、設定した間隔でアイテムの値が取得できなくなる問
題だと思います。
今まで時間がかかって値取得を諦めてしまっていたようなアイテム
でも、アイテムの値を取得しようと待ってしまうため、それぞれの
アイテムの値の取得にかかる時間が長くなり、一定の時間内に取得
できるアイテムの個数が少なくなる場合があるからです。
タイムアウトの値を伸ばすのであれば、キューに溜まってしまって
いないかも確認するようにしてください。
fripperさんが書かれている通り、負荷やキューの状態によっては、
取得するアイテムのタイプに合わせたPollerのプロセス数を増加さ
せることが必要になるかもしれません。
他にも、ネットワークディスカバリの機能を使用していると、その
ディスカバリのための通信のタイムアウトも伸びるらしいので、デ
ィスカバリルールで指定したアドレスの範囲の走査に時間がかかっ
てしまって、ディスカバリの時間間隔ではすべてのアドレスをチェ
ックしきれない状況が発生してしまわないよう注意が必要そうです。
RYT - 投稿数: 52
fripper様
わかりやすい説明をいただきありがとうございます。
とても勉強になりました。
監視収集方法などによって変更するパラメータを見極める必要があるようですね。
Timeout値はどちらも同じ値にしておいたほうがいいのかと勝手に思っていました。
注意点についてはやはり監視に遅延が出る可能性があるようですね。
対応方法を検討いたします。
TNK様
補足情報ありがとうございます。
ネットワークディスカバリにも影響があるのですか。
教えていただきありがとうございます。
お二人とも詳細に説明していただきありがとうございましました。