first network error, wait for 15 secondsエラーについて
サーバは落ちておらず、監視アイテムの値も取得できているのですが、
zabbix_server.logに下記のようなエラーを延々と吐き続けるというものです。
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
18979:20110509:165301.614 Item [server1:system.cpu.load[,avg15]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
18979:20110509:165301.615 Zabbix Host [server1]: first network error, wait for 15 seconds
18978:20110509:165302.615 Item [server1:vfs.fs.size[c: ,pused]] error: Get value from agent failed: *** Cannot connect to [192.168.1.11]:10050 [Interrupted system call]
18978:20110509:165302.616 Zabbix Host [server1]: another network error, wait for 15 seconds
18983:20110509:165320.381 Item [server1:vfs.fs.size[d: ,pused]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
18983:20110509:165320.382 Zabbix Host [server1]: another network error, wait for 15 seconds
18981:20110509:165321.788 Item [server3:perf_counter[\Processor(_Total)\% Processor Time]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
18981:20110509:165321.789 Zabbix Host [server3]: first network error, wait for 15 seconds
18981:20110509:170301.156 Item [server1:system.cpu.load[,avg15]] error: Get value from agent failed: *** Cannot connect to [192.168.1.11]:10050 [Interrupted system call]
18981:20110509:170301.157 Zabbix Host [server1]: first network error, wait for 15 seconds
18980:20110509:170304.009 Item [server3:system.cpu.load[,avg15]] error: Get value from agent failed: *** Cannot connect to [192.168.1.13]:10050 [Interrupted system call]
18980:20110509:170304.010 Zabbix Host [server3]: first network error, wait for 15 seconds
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
このようなエラーが起こしたホストは以下のとおりです。
・server1
・server2
・server3
この3台のホストが他の監視対象ホストと違うところは、
距離がかなり遠いです。
この3台のホストにPingするtimeは、300〜400msぐらいですが、
他の監視ホストにPingするtimeは、<1msです。
◆環境
・サーバ側:Zabbix1.8.4、CentOS5.5
・クライアント側:Windows2003
・監視アイテム:ログ監視、ディスク容量監視、Ping監視
◆ConfigFile
・zabbix-agentd.conf
timeout=20 (Defaultは3ですが、20に変更しました。)
何か設定してやれば良いのか解らず、苦慮しております。
もし、解決法やアドバイス等ありましたらよろしくお願いします。
TNK - 投稿数: 4742
恐らく、エージェントから値を取得しようとしてタイムアウト時間
以内に応答がなかったのだと思われます。
zabbix_server.confの方のTimeoutの値はいくつになっていますか?
Tanya - 投稿数: 26
Timeout=3(Default値)です。
どのぐらい設定するのを推薦してもらいませんでしょうか。
TNK - 投稿数: 4742
server1、server2、server3上で稼動しているZabbixエージェント
が応答を返すまでにかかる時間よりも長い時間に設定すれば良いと
思います。
環境に依存するので推奨値ではありませんが、例えば10秒に設定して
それでも同じエラー
<code>
Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
</code>
が発生するようであれば、さらに延長するというように調整してみ
て下さい。
Tanya - 投稿数: 26
ご回答ありがとうございます。
昨日の午後、Zabbix_server.confにあるTimeoutを20秒に設定しましたが、現在まで、first network error, wait for 15 secondsエラーが出ていませんでした。
このエラーを解決しました。本当にありがとうございます。
以上