日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

Zabbix APIでイベントを取得した時にマクロを展開する方法について

はじめてまして、kobatoと申します。

Zabbix APIでイベントを取得した時に、イベント名にあるマクロが展開されずに困っています。
APIに渡しているメソッド、パラメータは以下のようになります。
APIのマニュアルを見てもマクロが展開されるようなパラメータは見つかりませんでした。

method:event.get,
param:{
select_acknowledges : extend,
selectTriggers : extend,
select_alerts : extend,
output : extend,
sortfield : eventid,
sortorder : DESC,
object : 0,
limit : 1000
}

どなたか、Zabbix APIの実行結果にマクロが含まれている場合に、
それを展開する方法について教えて頂けないでしょうか。

proc.numキー使用でのプロセス監視不能について

いつもお世話になっております。

proc.numキーを使用して監視対象サーバから値を取得し、LAST値を使ってトリガー判定しています。
nfsのrpciodだけプロセスが起動しているにもかかわらず取得値(0)が返ってきてしまうことに悩まされています。

同様に設定してあるアイテム設定では正常に値が取れており、proc.numの第4引数(cmdline)の文字列を変更すると更に取得値が代わり内部的にどのように動作しているのか理解できず困っています。

環境詳細
監視サーバ
zabbix1.8 centOS6.1
アイテム proc.num[,"root","all","rpciod"]
トリガー {hostname:proc.num[,"root","all","rpciod"].last(0)}<1
コマンド zabbix_get -s {hostname} -k "proc.num[,"root","all","rpciod"]"
結果 0

監視対象サーバ
zabbixagent1.8 redhat el5

同じnfsのportmapは同様の条件式で正常に取れています。
proc.numがどのように値を取得しているかご存知の方いましたらご教授いただけますでしょうか

仮想マシンの再起動を検知する方法

初めて投稿いたします。

現在、zabbix:Ver1.8(物理)、OS:CentOS6.2(仮想ホスト)で監視環境を構築しています。

仮想ホストの死活監視に「icmpping」を用いることを検討しておりましたが、
下記の理由で行き詰っております。
--------------------------------------------------------------------------------
・アイテムの更新間隔は、最短60秒と制限されている。
 *zabbix server の管理部門が私の部門と異なり、
  変更できないため。

・仮想マシンの再起動は、30秒前後で完了しまうので
 再起動の検知ができないケースがある。
--------------------------------------------------------------------------------

私の案として、
・完全停止の検知は、「icmpping」で監視。
・再起動の検知は、ログファイル監視を行い、起動メッセージを確認。
とトリガーを2つ利用する考えたのですが、他に案はございますでしょうか?

アドバイス等頂けると幸いです。

カスタム Low Level Discovery サンプル

ユーザ定義で、オリジナルの Low-level discovery を使う際の参考になれば‥。
自身のブログみたいなものを持っていないので、情報共有も兼ねて。

1.今回のサンプルでは、rubyを利用していますので、agent 側ホストに ruby が必要です
2.agent 側の zabbix_agentd.conf に、次のような UserParameter 定義を追加します

UserParameter=user.useraccount.discovery, /usr/local/ruby/bin/ruby /path/to/script/user.discovery.rb

3.添付の user.discovery.rb_.txt を、上記の agentd.conf で指定したパス・ファイル名で配置します

この時点で、agentd を再起動して、動作を確認します

shell # zabbix_get -s xx.xx.xx.xx -k user.useraccount.discovery
{"data":[{"{#UNAME}":"root",
"{#UID}":"0",
"{#GID}":"0",
"{#HOMEDIR}":"/root",

ログ監視のトリガー動作

お世話になります。

Windowsのイベントログ監視でトリガーが意図した動作をしない場合がある為、投稿させて頂きます。

zabbix-server:2.05
zabbix-agent:2.04

【アイテム設定】
タイプ:Zabbixエージェント(アクティブ)
キー:eventlog[system,,"Warning|Error"]
データ型:ログ
更新間隔:300

【トリガー設定】
条件式:{(hostname):eventlog[system,,"Warning|Error"].regexp(..*)}=1=0
障害イベントを継続して生成:チェックする

期待する動作は一度検知した障害メッセージの再通知は行わず、最後の障害検知後のしばらくメッセージがなければ、トリガーのステータスを基に戻したいのですが、上記設定だと、10秒前後でトリガーステータスが正常に戻る場合と、30秒経過後に障害再通知がされた後、正常に戻る場合があり、動作が安定しません。期待動作をさせるにはどのような設定が考えられますでしょうか?

コンテンツ配信