日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

監視対象サーバの運用停止について

いつもお世話になっています。

初めて投稿させて頂きます。
よろしくお願いいたします。

監視対象サーバ(エージェント)の運用停止で、
監視・情報収集は行わないが過去のデータの参照をしたいのですが、
設定方法がわかりません。

どのように設定すればよいでしょうか?

[zabbix server]
zabbix-1.8.2
CentOS release 5.8

Server {HOSTNAME} is unreachableが消えません。

お世話になります、TKHIと申します。

ZABBIX AGENTとの疎通ができているのに、Host statusのトリガー:Server {HOSTNAME} is unreachableによるアラートが消えません。

「ホスト」から「エージェントの状態」を見ると正常になっており、他のアラートを人為的に発生させると反応するので、AGENTは正しく動いているようです。

何か考えられる原因はありますでしょうか。
ZABBIXのバージョンは1.8.14です。

よろしくお願いいたします。

AWSにおけるzabbix監視ができません

お世話になります。TKHIと申します。

AWSにおいてzabbixでの監視をしようとしているのですが、agentとの通信がうまくいきません。

AWSのセキュリティグループから監視元と監視先のポート10050-10051に対して0.0.0.0/0に許可を与えており、
監視先の/etc/zabbix/zabbix_agentd.confでは、Server=監視元のグローバルIP とし、ポートの設定はデフォルトのままです。

監視先のサーバーでntstat -anp|grep 10050を実行すると以下のようになります。

tcp 0 0 127.0.0.1:10050 0.0.0.0:* LISTEN 13103/zabbix_agentd

webインターフェイスのホストの設定を見ても、接続先のグローバルIPに対し、ポート10050で接続するようになっています。

しかし、エージェントの状態が有効になりません。

# しかし、Server ○○ is unreachable も表示されません。

なお、OSはいづれもAmazon Linuxを使用しています。

ご教授いただけないでしょうか。
よろしくお願いいたします。

system.run でSIGPIPE

いつもお世話になっています。

system.run もしくはUserparameterを使用して、ZabbixエージェントにPingを実行させ、その結果を取得しようとしていますが、
結果を取り込むことができません。
エージェントのログではProcess listener error: ZBX_TCP_WRITE() failed [Broken pipe]が表示されています。

14085:20120824:110752.194 Requested [system.run[ping 10.32.147.246 -c 5 -w 6 | grep mdev,wait]]
14085:20120824:110752.194 Executing command 'ping 10.32.147.246 -c 5 -w 6 | grep mdev'
14085:20120824:110752.194 In zbx_popen() command:'ping 10.32.147.246 -c 5 -w 6 | grep mdev'
14085:20120824:110752.198 End of zbx_popen():6
  :
14085:20120824:110756.305 End of zbx_waitpid():2945

net.tcp.service[]のタイムアウト

Zabbix1.8.14でLinuxサーバを監視しております。
net.tcp.service[smtp]等が時折「障害(=0)」となり、実際には動作している各サービスの状況を誤認しております。
net.tcp.service[]のタイムアウトが固定値であり、変更できれば回避できそうである、という問題と認識しておりますが、間違いありませんでしょうか?

環境の再構築等は無理な状況ですので、出来ればトリガーの作り方で回避したいと考えています。
この問題を承知した上で、net.tcp.service[]を使って適切に各サービスの状況を把握するためにはどのようなトリガーを用意すべきでしょう?
1. 更新間隔を半分にして{hoge:net.tcp.service[smtp].count(#2,0)}=2
2. 更新間隔以上の時間を指定して{hoge:net.tcp.service[smtp].nodata(60)}=1
みたいな感じかと思っておりますが、試しにサービス止めて挙動を確かめる訳にも行かず…。

1.は同じ状況が連発すると結局誤認ですね。

更新間隔以下でnodata()を使って死を見ました。
更新直後のnodata()だけが=0で、その後のnodata()は全て変化無し=データ無し=1、と?

使いこなせる日は来るのでしょうか。: (

コンテンツ配信