zabbix version up後のicmpレスポンスについて
いつもお世話になっております。
zabbix 2.2.3が公開されたため、2.2.2からバージョンアップを行いました。
バージョンアップ後、以下事象が多発しています。
・ネットワーク機器に対するicmpのレスポンスが急激に悪化
(2.2.2の時:平均 2 ms / 2.2.3:平均 100ms)
2.2.3のリリースノートは一通り確認しましたが、該当する修正等は
無いように思います。
また、Windowsサーバ、Linuxサーバ等へのicmpはバージョンアップ
前後で変動があまりありません。
zabbix サーバ上から、対象ネットワーク機器にpingコマンド を実行
すると、どれも1ms程度でレスポンスは返ってきます。
対象のネットワーク機器は100台以上ありますが、全てで同じような
現象が発生しています。
何か原因があるのでしょうか。
■環境
zabbix:zabbix 2.2.3
OS:CentOS 6.5
監視アイテム:ICMP response time / キー:icmppingsec
ネットワーク機器:HP A3100
ご回答の程、よろしくお願い致します。
- chart.php_.png (115.21 KB)
TNK - 投稿数: 4769
直接的な影響ななさそうではあるのですが、ソースを比較すると
IPv6関連の差異があるようです。
また、手元の環境でいくつかのネットワーク機器に対して、
アイテム
icmppingsec[IPアドレス]
を設定してみましたが、pingコマンドと大きな差異があるようなも
のはみつかりませんでした。
ネットワーク機器の設定やアイテムの設定をどのように設定されて
いるのかを、より詳細にお教えいただくことは可能でしょうか?
例えば、テンプレートの、
Template ICMP Ping
を利用されているのでしょうか?
そして、そのネットワーク機器のホストの設定でインターフェース
などは、複数登録されていたりしますか?
ネットワーク機器としてHPの機器を挙げられていましたが、それ以
外の機器でも同様に遅延するようであれば、その機器のメーカーや
型番も可能であればお教えください。
よろしくお願いいたします。
TF0814 - 投稿数: 49
TNK様
ご回答ありがとうございます。
ホスト設定は、SNMPインターフェイスを使用しております。
その他のインターフェイスは設定しておりません。
アイテム設定は、仰られている通り標準の「Template ICMP Ping」
テンプレートを使用しています。特に変更は行っておりません。
また、その他の現象が発生しない機器も同一テンプレートを
使用しております。
現象が発生する機器
・HP A3100
・HP A5120(トピックを挙げた際に記載漏れておりました)
現象が発生しない機器
・HP A7506
・F5 BIG-IP 1600
・HP Proliant Serverシリーズ(DL360 G7 / DL580 G7)
よろしくお願い致します。
TF0814 - 投稿数: 49
かなり期間が空いてしまいましたが、自己解決(恐らく…)しましたので上げておきます。
機器に対して、SNMPでの監視も行っており、ver2.2.3で実装されたSNMP bulk requests
による負荷増加によるものと判断しました。
該当機器のリソースを確認すると、bulk requestsが走るタイミングで負荷が増加し、
icmpのレスポンスが低下しているようでした。
次期メジャーバージョン2.4でbulk requestsの使用を制御出来る?ようですので
次期バージョンでの対応としたいと思います。
TNK - 投稿数: 4769
まだ最終的な実装ではないかもしれませんが、2.4の開発版である
2.3.3では、各SNMPインターフェースの設定内に、
Use bulk requests
というチェックボックスが用意されていて、そのインターフェース
毎にbulkを利用するかどうかを選択できるようになっているようで
す。
# Webインターフェース上では確認済み。
2.2.2のままだと、それ以降に様々な不具合や脆弱性が修正されて
いるので、自己責任になってしまいますが、システム全体でbulk
requestを投げないようパッチをあてて、Zabbixのプログラムをビ
ルドしなおして利用することも検討してもよいかもしれません。
ご参考:
there should be a way to disable SNMP bulk for each interface
https://support.zabbix.com/browse/ZBXNEXT-2301
※ただし、添付されているパッチは2.2.4までですし、公式なパ
ッチでもありません。
KAZ - 投稿数: 1085
TF0814さん
一応、2.2.3/2.2.4でbulkを使わなくするパッチあります。
https://support.zabbix.com/browse/ZBXNEXT-2301
ただ、これはbulk requestsでsnmp項目が取得できなくなる問題の対応なので、負荷が下がるかは確認してないです。
TF0814 - 投稿数: 49
本日、Zabbix2.4を導入し、snmp bulk request設定を解除したところ、
icmpのレスポンスが以前どおりに改善しました。
やはり、snmp bulk requestが原因だったと思われます。
ご教授頂きありがとうございました。