グラフが途切れてしまいます
初めて質問させて頂きます。
CentOS5.5 にZabbix 1.8.3をインストールし、Ciscoのネット
ワーク機器のトラフィックを監視したいと考えています。
「設定」→「ホスト」→「ホストの作成」でホストを作成し
「アイテム」→「アイテムの作成」でアイテムを作成しました。
アイテム抜粋
タイプ = SNMPv2エージェント
SNMP OID = ifInOctets.**
SNMPポート= 161
データ型 = 整数(浮動小数)
単位 = bps
乗数を使用=使用する(8)
保存時の計算 差分/時間
上記の設定をし、結果のグラフを作成すると、グラフが表示さ
れるので正常に値を取得できているようなのですが、突然、グ
ラフが途切れて一定期間表示されなくなります。そして30分程
度時間が経過するとまたグラフが表示され始めます。
(一定の時間帯だけグラフが途切れる状態です。過去のグラ
フ、その後のグラフは表示されます。)
ただ、状態を見ているとどうも100Mbpsを超える位のトラフィッ
クがある時にグラフが途切れるようです。
DBはMySQL(5.0.77)を使用しています。また、グラフが途切れて
いる時にLinuxサーバ上でtopコマンドを実行してみると、CPU、
メモリ共に殆ど負荷がかかっていません。Mysql、zabbixのログ
にも特にエラー等は出ていません。
※グラフが途切れているときに、Linuxサーバから snmpwalk コ
マンドを実行すると正常に値を取得します。
なぜグラフが途切れるのか、お分かりになる方がいましたら教え
て頂けますか。
よろしくお願いします。
TNK - 投稿数: 4729
Zabbixサーバの負荷が高い状態で無いならば、ルータからの応答が遅れてタイムアウトが発生してしまったことが考えられます。
とのことですが、どの位の応答時間ですか?
ctr0027 - 投稿数: 5
返信いただきありがとうございます。
ご指示通り、グラフが途切れているときにZabbixがインス
トールされているサーバからsnmpwalkを実行しました。
time snmpwalk -v 1 -c *****
取得した値 ***
real 0m0.037s
user 0m0.031s
sys 0m0.003s
〜〜〜〜〜〜〜〜〜〜〜
コマンドの先頭にtime を付けて応答時間を測定したのですが
正常にグラフが表示されているときと殆ど変らない応答時間で
した。
また、試しにアイテムの設定部分で、「SNMP OID」を「ifInOctets.*」
としていたところを、1.3.6.1.2.1.2.2.1.10.*と変更してみ
たのですが結果は変わらず定期的にグラフが途切れてしまいます。
(余計な値を取得しなくなるのでは?と考え、SNMP OIDで欲しい値を指定してみました。)
問題を解決するヒントをご存じであれば教えて頂けますか。
お手数をお掛けしますがよろしくお願いいたします。
ctr0027 - 投稿数: 5
グラフが定期的に途切れる件ですが、設定を変更する事で
途切れなくなりました。
変更箇所
設定→ホスト→アイテム→各アイテム内の
更新間隔(秒)を「300」にするとグラフが途切れてしまうのですが
「30」又は「60」に変更すると正常にグラフが表示されるように
なりました。
※なぜこの値によってグラフが途切れるのかは分かりません。ただ、
その他の設定は一切触っていないので、この値が問題だったと思います。
kodai - 投稿数: 1341
グラフが途切れている間、監視データ自体は収集されているでしょうか?
Webインターフェースから[監視データ]→[最新データ]→問題のアイテムの「グラフ」をクリック→右上のドロップダウンから「値」を選択して、問題が発生している時間帯のヒストリの値を貼り付けていただければ何か分かるかもしれません。
ctr0027 - 投稿数: 5
ご回答頂きありがとうございます。
グラフが途切れている間のヒストリの値は以下の通りです。
2010.9月.30 10:39:22 46286185.6533
2010.9月.30 10:29:22 54569604.2667
2010.9月.30 10:19:22 62156172.96
2010.9月.30 10:09:22 62152742.6933
2010.9月.30 09:59:22 42893086.32
2010.9月.30 09:49:22 39728812
2010.9月.30 09:44:22 38418229.5733
2010.9月.30 09:39:22 32077600.1067
2010.9月.30 09:29:22 26160458.6133
2010.9月.30 09:24:22 32420074.7733
2010.9月.30 09:19:22 19088135.0933
2010.9月.30 09:09:22 20558915.1467
2010.9月.30 09:04:22 16698912.1867
上記期間で、
9時10分から20分位の間はグラフなし
9時30分から40分位の間グラフなし
9時50分位から10時40分の間、グラフの線は表示されな
いが、点だけ4つ表示されている。
というのがグラフの状態です。
ただ、気が付いたのですが、更新間隔を当初300秒
に設定していたのですが、10分間隔や5分間隔等に
なっています。これらもグラフが表示されなかった
事と関係がありそうですね。
以上、お手数をお掛けしますがよろしくお願いいたします。
kodai - 投稿数: 1341
返信おそくなりました。
ところどころ数値が取れていないようなので、トラフィックが多いときにSNMPのカウンタ値が0に戻ってしまっているのかもしれません。
取得するOIDを32ビットのものから64ビットのものに変えると解決しないでしょうか?
以下のフォーラムも参考にしてみてください。
http://www.zabbix.jp/modules/newbb/viewtopic.php?topic_id=541&forum=2&viewmode=flat&order=ASC&start=0
ctr0027 - 投稿数: 5
返信が遅くなりました。
また、ご回答いただきありがとうございます。
教えて頂いたURLを拝見しました。オーバーフローが発生していた
影響でデータが正常に取得できていなかったとの事で納得できました。
OIDを32ビットのものから64ビットのものに変えてみようと考えた
のですが、アイテム数が多くかなりの手間になりそうなので、一先
ずデータ取得間隔を5分から1分に変更して現在稼働させています。
もしデータ量が増えて、1分でもデータ取得ができなくなった場合は
OIDを64ビットのものに変えようと思います。
色々とありがとうございました。