大規模監視におけるping遅延について
shin19と申します。
ZABBIXフォーラムにはいつもお世話になっております。
早速ですが、質問させて下さい。
以下の環境、設定で約2000ホストに対し、ping監視を行っております。
サーバ
OS:Linux
CPU:2vCPU
メモリ:4G
zabbix
バージョン:2.0.4
監視対象:2000IP
監視方法:icmpping (シンプルチェック)
間隔:120秒
my.cnf
innodb_file_per_table
innodb_buffer_pool_size=3072M
innodb_log_file_size=768M
その他デフォルト
zabbix_server.conf
StartPollers=20
StartPingers=5
その他デフォルト
監視 -> キューを確認すると1500以上の項目が5秒~5分遅延していることが確認できます。
また、「Zabbix busy icmp pinger processes, in %」は常に100%です。
上記のパラメータで修正すべき点などがありましたら、アドバイス頂けませんでしょうか。
どうぞよろしくお願いいたします。
TNK - 投稿数: 4769
シンプルチェックのicmppingでキューにたまってしまうようであれ
ば、StartPingersの値を、大きくすれば良いと思います。
デフォルト値は、1で、すでに5に変更されているようですが、対象
が2000ホストと多いので、1回のチェックにどれだけの時間がか
かるかではあるのですが、StartPingersの値を少し大きくして、
zabbix_serverプロセスを再起動してみてください。
shin19 - 投稿数: 47
TNK様
ご返信ありがとうございます。
実際にStartPingersの値を徐々に大きくしてみました。
やはりなかなかキューが減らず、
40まで値を増やしたところで、zabbix serverプロセスがdownしてしまいました。。
35あたりで約700項目が5秒~30秒遅延している状態までに収まったのですが、
(「Zabbix busy icmp pinger processes, in %」は97%)
2000IPを監視する場合は、これぐらいが限界でしょうか。
すみません、よろしくお願い申し上げます。
TNK - 投稿数: 4769
以下の環境で、StartPingersの値を100まであげても正常に起動で
きています。
OS : CentOS 6.3 (i686)
メモリ: 1GB
Zabbix 2.0.6
Pingerを増加させる場合、それらを稼働させるためにメモリなどの
リソースを消費しますので、恐らく、メモリなどが確保できずに、
zabbix_serverが起動できない状態なのではないでしょうか?
再度、ログに何か出力されていないかをご確認ください。
shin19 - 投稿数: 47
TNK様
遅くなり申し訳ありません。
ご返信ありがとうございます。
もう一度ログ、リソースなどを確認をしてみます。
ご対応頂き、ありがとうございました。
kodai - 投稿数: 1341
Pingerの数を大きくしてもパフォーマンスが改善されないということでしたら、他のところにボトルネックがあるのかもしれません。
あまり変化はないかもしれませんが、/tmpにディスクを利用されているのであればtmpfsを使うなども試してみてください。