日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

ポーリング監視のリトライによる誤検知防止について

お世話になります。

現在、Zabbix2.0.8を構築し、もう一つのオープンソース統合監視ツールのNagiosと比較しております。
そこで、表題の件についてのご質問させていただきます。

Nagiosでの誤検知防止として、通常監視間隔(check_interval)、リトライ間隔(retry_interval)、リトライ回数(max_check_attempts)を
設定することが可能ですが、Zabbixでも同様の動作をさせるための設定方法はありますでしょうか?

Nagiosの誤検知防止の動作は、通常5分間隔でポーリングし異常を検知すると、1分後にリトライし再度結果が異常であれば、
アラートメールを送信することができます。
Nagiosの define host もしくは define service で以下のパラメータにより設定可能です。
====
check_interval : 5 [分]
retry_interval : 1 [分]
max_check_attempts : 2 [回]
====

このときNagiosの管理画面上では、5分間隔の監視で異常を検知(1回目)するとCRITICALと表示されますが、
アラートメールはリトライでの監視結果で異常を検知(2回目)しないと送信されません。

マップのtracerouteコマンドについて

zabbix2.0.6にadminでログインしてマップ上からWindows端末にtracerouteを使うと以下のように出ます。
これはなぜでしょうか?(正常に見れるものと以下のように出るものがあります)

traceroute to 192.168.1.180 (192.168.1.180), 30 hops max, 60 byte packets
1 * * *
2 * * *
3 * * *
4 * * *
5 * * *
6 * * *
7 * * *
8 * * *
9 * * *
10 * * *
11 * * *
12 * * *
13 * * *
14 * * *
15 * * *
16 * * *
17 * * *
18 * * *
19 * * *
20 * * *
21 * * *
22 * * *
23 * * *
24 * * *
25 * * *
26 * * *
27 * * *
28 * * *
29 * * *
30 * * *

WindowsServerのイベントログ監視、及びメール通知について

WindowsServerのイベントログ監視、及びメール通知がうまくいかないため相談させてください。

■達成したいこと
単純にイベントログにシステムエラーが記録されたときにメール通知をしたいだけです。

■現在の設定
【アイテム】
・タイプ:Zabbixエージェント(アクティブ)
・キー:eventlog[System]
・データ型:ログ
・更新間隔(秒):1
・ヒストリの保存期間(日):7

【トリガー】
・条件式:{アイテム名:eventlog[System].logseverity(0)}=4
・深刻度:軽度の障害

【アクションの実行条件】
(A) メンテナンスの状態 期間外 "メンテナンス"
(B) トリガーの値 = "障害"
(C) ホスト = "対象ホスト"

■状況
ZabbixWEBコンソールのダッシュボードではシステムエラーは正しく拾えていますが
メールが配信される場合とされない場合があります。

対象ホストでコマンドプロンプトから「eventcreate」でシステムログの
エラーを擬似的に生成した場合はメールが配信されません。

■質問内容
上記のような状況ですが何か設定が足りないのでしょうか。
お手数ですがアドバイスいただければと思います。

zabbixエージェントが認識されずエラーとなります。

以下環境で、zabbixエージェントの監視を行いたいのですが、以下のエラーが発生しており、エージェントが認識されません。

■環境
Zabbixサーバ:2.0.5
zabbixエージェント:1.8.5(OSはwindows server 2008 r2 standard)

■エラー
Get value from agent failed: ZBX_TCP_READ() failed: [4] Interrupted system call

ネットワークの問題かと思い、以下を確認しましたが問題なさそうです。
 ・zabbixサーバ→zabbixエージェントで10050ポートの疎通
 ・zabbix_agentd.confのserverの値(IPアドレス、DNSどちらで設定しても上記エラーが発生します。)
 ・シンプルチェックでポート監視、ping監視は正常に行えております。

※その他
 ・監視対象のサーバにはNICが2つ接続されており、それぞれ別のIPアドレスが振られています。監視用として利用しているのはその内の一方のIPアドレスとなります。
 ・現在zabbixサーバを1.8.5から2.0.5に移行しており、1.8.5のサーバ上では正常にエージェント監視ができておりました。

Zabbixサーバのtimerプロセスのメモリリークについて

お世話になっております。

現在、管理しているZabbixサーバでメモリリークの問題が発生しており
いくつか質問させて頂きたいです。

Zabbixバージョン:1.8.5-1
サーバサイズ:m1.large(AWS)
メモリ:7.3GB
CPU:4ECU

過去のフォーラムを参照したところ
Zabbix起動時のメッセージで出力される
各プロセスの役割を確認できるとの事なので
リークしているプロセスを確認したところ
「timer」のプロセスでメモリがリークされている事が分かりました。

http://www.zabbix.jp/node/1874

過去のリリースノートを確認し
こちらのプロセスに関する不具合を確認いたしましたが
特に見受けられませんでした。

Web上で情報を探してみましたが
メンテナンス設定に絡むものと、いったもの以外に特に見つけられませんでした。

以下の質問についてご回答をお願いしたいです。
①「timer」のプロセスの役割についてご教授頂けますでしょうか。
②メンテナンス中の監視ホストのアイテムがキューにたまり続けているのですが
 こちらとメモリリークは関係ありますでしょうか。

Zabbxiサーバ起動時ログ(一部抜粋)

コンテンツ配信