日本Zabbixユーザー会フォーラム

system.run もしくはUserparameterを使用して、ZabbixエージェントにPingを実行させ、その結果を取得しようとしていますが、
結果を取り込むことができません。
エージェントのログではProcess listener error: ZBX_TCP_WRITE() failed [Broken pipe]が表示されています。

14085:20120824:110752.194 Requested [system.run[ping 10.32.147.246 -c 5 -w 6 | grep mdev,wait]]
14085:20120824:110752.194 Executing command 'ping 10.32.147.246 -c 5 -w 6 | grep mdev'
14085:20120824:110752.194 In zbx_popen() command:'ping 10.32.147.246 -c 5 -w 6 | grep mdev'
14085:20120824:110752.198 End of zbx_popen():6
　：
14085:20120824:110756.305 End of zbx_waitpid():2945

net.tcp.service[]のタイムアウト

2012/08/22 - 18:24 (水) finger5 - 投稿数: 5

日本Zabbixユーザー会フォーラム

Zabbix1.8.14でLinuxサーバを監視しております。
net.tcp.service[smtp]等が時折「障害(=0)」となり、実際には動作している各サービスの状況を誤認しております。
net.tcp.service[]のタイムアウトが固定値であり、変更できれば回避できそうである、という問題と認識しておりますが、間違いありませんでしょうか？

環境の再構築等は無理な状況ですので、出来ればトリガーの作り方で回避したいと考えています。
この問題を承知した上で、net.tcp.service[]を使って適切に各サービスの状況を把握するためにはどのようなトリガーを用意すべきでしょう？
1. 更新間隔を半分にして{hoge:net.tcp.service[smtp].count(#2,0)}=2
2. 更新間隔以上の時間を指定して{hoge:net.tcp.service[smtp].nodata(60)}=1
みたいな感じかと思っておりますが、試しにサービス止めて挙動を確かめる訳にも行かず…。

1.は同じ状況が連発すると結局誤認ですね。

更新間隔以下でnodata()を使って死を見ました。
更新直後のnodata()だけが=0で、その後のnodata()は全て変化無し=データ無し=1、と？

使いこなせる日は来るのでしょうか。: (

コメント数 4

日本Zabbixユーザー会

日本Zabbixユーザー会フォーラム

監視対象サーバの運用停止について

Server {HOSTNAME} is unreachableが消えません。

AWSにおけるzabbix監視ができません

system.run でSIGPIPE

net.tcp.service[]のタイムアウト

ユーザーログイン

Twitter