監視に必要な回線品質と監視規模について

2点ご質問があります。

1点目
監視対象と監視サーバ間が大阪⇔北海道と、遠距離でのリソース、死活監視を検討しています。
遠距離だとレイテンシなど回線品質が多少なりとも劣るとおもいます、それが監視に影響がでないかと懸念しております。

監視するにあたり、
回線品質の基準などあればご教授いただけますでしょうか。

2点目
監視規模の表現についてです。
1000台または100000万監視項目までと表現されていることが多いんですが、
これは、1000台以内かつ100000監視項目以内ということでよいのでしょうか。

1台あたり1監視項目であれば100000台まで監視ができると捉えることもできますので。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー kng の写真

それぞれ、監視内容・監視間隔によると思います。
pingを利用した疎通確認であれば、タイムアウト値を
指定して、許容範囲を設定すれば済むでしょうし、
どこまで許容できるか?次第ではないでしょうか。

二点目については、ハードウェアの性能次第かと思います。
10万台の機器に対して、pingを60秒間隔でチェックすること
を考えると、一秒あたりおよそ1700台分処理できなくては
いけないし、待ち時間などを加味するとそれ以上になります。

監視規模については、目安であり、環境により異なりますので
検証環境などで、ある程度の許容できる数値を見極めるより
ほかないのではないかと思います。

細かくは設計の話しになってしまうので、解答は難しい
でしょうね。。。

広瀬です

1に関して

回線品質は通信事業者、及びその足回りで大幅に変わります。IXにダイレクトしている、
していないなどでも変わってくるでしょう。大阪-北海道区間を最短のルーティングを持
っている事も重要なポイントだと思います(東海周り?北陸周り?・・・等々)。

各回線事業者が公開は恐らくしているだろう、SLAにも遅延時間が記載はされていると
思いますので、素直に事業者に問い合わせてみるのが最良だと思います。

2に関して

1000台か、10万項目かという表現に関しては、どちらとも取れてしまうので些か秤難い
とはおもいますが、そこは表現の問題に踊らされない様にするのがベストです。

たとえば、8コアCPUでusr/sys/nice/idle/iowait/hwirq/swirq/stealの8種全部を
コア単位と、平均、及びload avgを取った場合、それだけで80項目近くに達します。載
せているCPU数が物理2個ならばその倍です(実際に私の所でも8コアサーバだと、C
PUだけで60項目近いです)。
実際にはCPUだけではなくHDD、メモリ、ネットワークなどもリソース対象な訳ですから、
1サーバで200~前後行くのもざらだと思います。

 ※Zabbixエージェントタイプでも変わりますね。PassiveモードだとTIME WAIT問題に
   抵触する場合もあります。これはOS(正確にはTCP/IPか)仕様制限です

 ※他、OSによりマチマチですが、65535ポート全部が使えるように標準では無いって
   いない問題も出てきます。デフォルトではフル能力は発揮しません

なので、目安として1000台、または10万項目という表現を用いているという点に過ぎな
い事を理解頂いた方が良いと思います。
1サーバあたり、何の監視をどの程度、どの間隔で行うのかで変わります。ログ監視し
ようモノならば、多分上記の目安数値は落ちてくるでしょう。

色々考えなければならない問題は数多くあり、一概には言えないという事から回答が
難しいという点ご理解頂ければ幸いです。