大規模監視におけるping遅延について

shin19と申します。
ZABBIXフォーラムにはいつもお世話になっております。
早速ですが、質問させて下さい。

以下の環境、設定で約2000ホストに対し、ping監視を行っております。

 サーバ
  OS:Linux
  CPU:2vCPU
  メモリ:4G

 zabbix
  バージョン:2.0.4
  監視対象:2000IP
  監視方法:icmpping (シンプルチェック)
  間隔:120秒

 my.cnf
  innodb_file_per_table
  innodb_buffer_pool_size=3072M
  innodb_log_file_size=768M
  その他デフォルト

 zabbix_server.conf
  StartPollers=20
  StartPingers=5
  その他デフォルト

監視 -> キューを確認すると1500以上の項目が5秒~5分遅延していることが確認できます。
また、「Zabbix busy icmp pinger processes, in %」は常に100%です。
上記のパラメータで修正すべき点などがありましたら、アドバイス頂けませんでしょうか。
どうぞよろしくお願いいたします。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

シンプルチェックのicmppingでキューにたまってしまうようであれ
ば、StartPingersの値を、大きくすれば良いと思います。

デフォルト値は、1で、すでに5に変更されているようですが、対象
が2000ホストと多いので、1回のチェックにどれだけの時間がか
かるかではあるのですが、StartPingersの値を少し大きくして、
zabbix_serverプロセスを再起動してみてください。

ユーザー shin19 の写真

TNK様

ご返信ありがとうございます。
実際にStartPingersの値を徐々に大きくしてみました。
やはりなかなかキューが減らず、
40まで値を増やしたところで、zabbix serverプロセスがdownしてしまいました。。
35あたりで約700項目が5秒~30秒遅延している状態までに収まったのですが、
(「Zabbix busy icmp pinger processes, in %」は97%)
2000IPを監視する場合は、これぐらいが限界でしょうか。
すみません、よろしくお願い申し上げます。

ユーザー TNK の写真

以下の環境で、StartPingersの値を100まであげても正常に起動で
きています。

 OS  : CentOS 6.3 (i686)
 メモリ: 1GB
 Zabbix 2.0.6

Pingerを増加させる場合、それらを稼働させるためにメモリなどの
リソースを消費しますので、恐らく、メモリなどが確保できずに、
zabbix_serverが起動できない状態なのではないでしょうか?

再度、ログに何か出力されていないかをご確認ください。

ユーザー shin19 の写真

TNK様

遅くなり申し訳ありません。
ご返信ありがとうございます。

もう一度ログ、リソースなどを確認をしてみます。
ご対応頂き、ありがとうございました。

ユーザー kodai の写真

Pingerの数を大きくしてもパフォーマンスが改善されないということでしたら、他のところにボトルネックがあるのかもしれません。
あまり変化はないかもしれませんが、/tmpにディスクを利用されているのであればtmpfsを使うなども試してみてください。