zabbix version up後のicmpレスポンスについて

いつもお世話になっております。

zabbix 2.2.3が公開されたため、2.2.2からバージョンアップを行いました。
バージョンアップ後、以下事象が多発しています。

 ・ネットワーク機器に対するicmpのレスポンスが急激に悪化
  (2.2.2の時:平均 2 ms / 2.2.3:平均 100ms)

2.2.3のリリースノートは一通り確認しましたが、該当する修正等は
無いように思います。
また、Windowsサーバ、Linuxサーバ等へのicmpはバージョンアップ
前後で変動があまりありません。
zabbix サーバ上から、対象ネットワーク機器にpingコマンド を実行
すると、どれも1ms程度でレスポンスは返ってきます。
対象のネットワーク機器は100台以上ありますが、全てで同じような
現象が発生しています。

何か原因があるのでしょうか。

■環境
 zabbix:zabbix 2.2.3
 OS:CentOS 6.5
 監視アイテム:ICMP response time / キー:icmppingsec
 ネットワーク機器:HP A3100

ご回答の程、よろしくお願い致します。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

直接的な影響ななさそうではあるのですが、ソースを比較すると
IPv6関連の差異があるようです。

また、手元の環境でいくつかのネットワーク機器に対して、

 アイテム
  icmppingsec[IPアドレス]

を設定してみましたが、pingコマンドと大きな差異があるようなも
のはみつかりませんでした。

ネットワーク機器の設定やアイテムの設定をどのように設定されて
いるのかを、より詳細にお教えいただくことは可能でしょうか?
例えば、テンプレートの、

 Template ICMP Ping

を利用されているのでしょうか?
そして、そのネットワーク機器のホストの設定でインターフェース
などは、複数登録されていたりしますか?

ネットワーク機器としてHPの機器を挙げられていましたが、それ以
外の機器でも同様に遅延するようであれば、その機器のメーカーや
型番も可能であればお教えください。

よろしくお願いいたします。

ユーザー TF0814 の写真

TNK様

ご回答ありがとうございます。

ホスト設定は、SNMPインターフェイスを使用しております。
その他のインターフェイスは設定しておりません。

アイテム設定は、仰られている通り標準の「Template ICMP Ping」
テンプレートを使用しています。特に変更は行っておりません。
また、その他の現象が発生しない機器も同一テンプレートを
使用しております。

現象が発生する機器
・HP A3100
・HP A5120(トピックを挙げた際に記載漏れておりました)

現象が発生しない機器
・HP A7506
・F5 BIG-IP 1600
・HP Proliant Serverシリーズ(DL360 G7 / DL580 G7)

よろしくお願い致します。

ユーザー TF0814 の写真

かなり期間が空いてしまいましたが、自己解決(恐らく…)しましたので上げておきます。

機器に対して、SNMPでの監視も行っており、ver2.2.3で実装されたSNMP bulk requests
による負荷増加によるものと判断しました。
該当機器のリソースを確認すると、bulk requestsが走るタイミングで負荷が増加し、
icmpのレスポンスが低下しているようでした。

次期メジャーバージョン2.4でbulk requestsの使用を制御出来る?ようですので
次期バージョンでの対応としたいと思います。

ユーザー TNK の写真

まだ最終的な実装ではないかもしれませんが、2.4の開発版である
2.3.3では、各SNMPインターフェースの設定内に、

 Use bulk requests

というチェックボックスが用意されていて、そのインターフェース
毎にbulkを利用するかどうかを選択できるようになっているようで
す。
# Webインターフェース上では確認済み。

2.2.2のままだと、それ以降に様々な不具合や脆弱性が修正されて
いるので、自己責任になってしまいますが、システム全体でbulk
requestを投げないようパッチをあてて、Zabbixのプログラムをビ
ルドしなおして利用することも検討してもよいかもしれません。

ご参考:
 there should be a way to disable SNMP bulk for each interface
 https://support.zabbix.com/browse/ZBXNEXT-2301
 ※ただし、添付されているパッチは2.2.4までですし、公式なパ
  ッチでもありません。

ユーザー KAZ の写真

TF0814さん

一応、2.2.3/2.2.4でbulkを使わなくするパッチあります。
https://support.zabbix.com/browse/ZBXNEXT-2301

ただ、これはbulk requestsでsnmp項目が取得できなくなる問題の対応なので、負荷が下がるかは確認してないです。

ユーザー TF0814 の写真

本日、Zabbix2.4を導入し、snmp bulk request設定を解除したところ、
icmpのレスポンスが以前どおりに改善しました。
やはり、snmp bulk requestが原因だったと思われます。

ご教授頂きありがとうございました。