日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

CPU負荷時の原因調査について

いつもお世話になっております。

CentOS 5.7 zabbix1.6の環境にて監視先サーバのsystem.cpu.util[,system,avg1]、およびsystem.cpu.util[,user,avg1] を
10秒ごとに取得し、閾値にて警告が通知されるように設定しています。

監視先サーバが同様の構成のサーバであるにも関わらず、片側だけ瞬間的に100%になり引っかかることがあり、
原因を調査しております。

何かのアイテムの設定により、上記の原因を調査できるような良い方法等がありましたら、
教えていただけないでしょうか。

自分で考えた手段としまして、psコマンドで0%以上のものを取得するシェルをエージェント側で上記と同タイミングにて
動作させてアイテム値を取得しようとしましたが、警告時に特に出力がありませんでした。

zabbix_senderのunixtimeについて

いつも参考にさせていただいております。

細かい話なのですがzabbixサーバにzabbix_senderでデータを送付する際に指定したunixtimeとzabbix側で取り込まれる時間が、なからず1秒ずれてしまいます。
実用上の問題は、まったくありません。
同様なことで心当たりのある方がいれば、アドバイスいただければと考えました。

・確認したこと

(1)12/24 00:00:00のunixtimeをdateコマンドで求め、逆変換して確認する。
(2)dateコマンドで作成したunixtimeを使ってzabbix_senderの入力データを作成する。
(3)zabbix_senderでzabbixにデータを送信する。
(4)zabbixでデータを確認する。

・結果

(1)dateコマンドでのunixtime作成と逆変換して確認

以下の通りunixtimeを求めて正しく逆変換できました。
$ date +%s --date "2012/12/24 00:00:00"
1356274800
$ date --date "@1356274800"
2012年 12月 24日 月曜日 00:00:00 JST
$

(2)zabbix_senderの入力データ作成

zabbix_get 経由での取得値とローカルで実行して返ってきた値について

いつもお世話になっております。

zabbix1.6 centOS 5.7 にて現在、設定をしております。

エージェント側でシェルを実行して出る値とサーバ側からzabbix_get 経由で実行した結果が異なるという
現象が発生しました。

具体的にやったことは、DRBD のプロセス数を監視しようとproc.num のキーで取得しようとしましたが、
うまく取得できずプロセス数を取得するシェルを作成しました。
(作成したシェルを一番下に記載します)

そして、エージェントのagentd.conf に下記設定を追記し、エージェントを再起動しました。
設定======================================
UserParameter=drbd.procnum,/etc/zabbix/drbd_chk.sh
==========================================

エージェント側でシェルを実行した場合は、「0」が返って来るのに対し
# /etc/zabbix/drbd_chk.sh
0
zabbix_get で取得した場合、「2」や「3」が返ってきました。
# /usr/sbin/zabbix_get -s XX.XX.XX.XX -k drbd.procnum
2

trap を受信するために必要な snmptrapd の設定について

  いつもお世話になります。

snmptrap 使った処理を考えております。

一旦、snmptrapd で受けた後に zabbix_sender に送るべく
スクリプトを作成しております。

snmptrapd の引数は、
 OPTIONS="-Ls0 -a -On -p /var/run/snmptrapd.pid"

としています。

スクリプトはまず、
#!/bin/bash

read hostname
read ip
read uptime

として、状態を確認している段階ですが、

trap 受信後 hostname は、
  
となってしまいます。
/etc/hosts ファイルに登録してやると、ホスト名は表示するようになります。

ip のフィールドには、
UDP: [10.000.0.0]:162->[10.111.1.1]
と入っており、これでは処理がし辛いです。

このままだと、sender に引き渡せません。

snmptrapd の設定に問題があるのか、
zabbix_sender の引き渡し方に問題があるのか
判断がついておりません。

どこに問題があるか教えていただけませんでしょうか。

よろしくお願いします。

マクロ「ITEM.VALUE」で扱うことができる小数点以下の桁数(ZABBIX2.0)

いつもお世話になっております。

現在v1.8.5を利用しており、今度v2.0.xへのバージョンアップを検討しています。
そこでv2.0.4で機能検証をしているのですが、アクションの設定でわからないことがあり投稿させていただきます。

アイテムのキーに「net.tcp.service.perf[tcp,,<ポート番号>]を設定しております。
そして、このアイテムに対応するアクションの中でマクロ「ITEM.VALUE」を設定しております。

すると、「ITEM.VALUE」の戻り値で不可解なことが発生しました。
WEBコンソール上の値は下記のとおりとなっています。
 ・「監視データ」→「概要」では「0.00010~0.00050」程度。
 ・「監視データ」→「概要」→「最新の値500個」では「0.0001~0.0005」程度。
にもかかわらず、「ITEM.VALUE」の戻り値は常に「0」となってしまいます。

WEBコンソール上の値が「0」でないにも関わらず、
「ITEM.VALUE」の戻り値が「0」となってしまうこと。
また、他のアイテム(整数値や小数点以下2桁程度のもの)に対して「ITEM.VALUE」を使うと正しく値が取得できることから、
扱える小数点以下の桁数が小数点以下2桁や3桁までなのではないかと疑っています。

コンテンツ配信