Get value from agent failed: cannot connect to [[10.123.10.134]:10050]: [111] Connection refuse

エージェントの状態が赤い状態のままで、Get value from agent failed: cannot connect to [[10.123.10.134]:10050]: [111] Connection refuseというエラーが出ています。

zabbix_agentd.confファイルは、ホスト名とzabbixマネージャのIPを正しく登録しています。
Server=10.123.10.251
ServerActive=10.123.10.251
Hostname=XXX-XXX-APP01

Connection refuseエラーの詳細の内容を知るには、どこのログを見たらよいかご教示いただけないでしょうか。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

エラーメッセージ内にある通り、

 [111] Connection refuse

というのがエラーの詳細です。
ZabbixサーバーからZabbixエージェントにアクセスしようとしたと
きに、TCP/IPレベルでのアクセスが拒否された状態のようです。

監視対象のサーバーのFirewall機能などで、Zabbixサーバーからの
アクセスを制限していないかを確認してください。

ユーザー yukiko の写真

zabbixサーバからエージェントのサーバには、pingは通ります。
また、ファイヤウォールの設定も、他の通信ができているエージェントのサーバと同じ設定にしてあるのですが、他の原因は考えられるでしょうか?

ping 10.123.10.134
PING 10.123.10.134 (10.123.10.134) 56(84) bytes of data.
64 bytes from 10.123.10.134: icmp_seq=1 ttl=255 time=0.197 ms
64 bytes from 10.123.10.134: icmp_seq=2 ttl=255 time=0.122 ms

ユーザー TNK の写真

pingのチェックでは不十分です。
pingのチェックでは、ネットワークの経路が到達できるかまでしか
確認できません。

今回の場合であれば、特定のポート番号(10050)を使用して通信で
きるかのチェックにはなりません。

監視対象のサーバーのOSは何ですか?
他の通信できているサーバーと同じ設定とのことですが、具体的に
どのような設定をされたのですか?

ユーザー yukiko の写真

ありがとうございます。
監視対象のサーバーのOSは何ですか?→Amazon linux 2です。

他の通信できているサーバーと同じ設定とのことですが、具体的に
どのような設定をされたのですか?

→他の通信できているサーバに付与しているawsのセキュリティグループと同じものを付与しました。

ユーザー yukiko の写真

監視対象のサーバのポートの状況を以下のコマンド見たところ、対象が存在しないようでした。
ということはポートが開いていないのでしょうか。
lsof -c zabbix_ag

ユーザー TNK の写真

Zabbixエージェントのプロセス(zabbix_agentd)は起動しています
か?
起動していないのであれば、起動してみてください。
起動できないのであれば、何らかのエラーが出力されていないかロ
グファイルを確認してください。

ユーザー yukiko の写真

ありがとうございます。確認してみます。

ユーザー yukiko の写真

お世話になっております。
監視対象サーバのプロセスを見たところ、statusを見ると、起動しているようにも見えますが、「実行中」と記載がないのが気になります。
プロセス一覧にはzabbix_agentがいません。
ということは、プロセスが起動していないということでしょうか?
また、ログをかくにんしたところ、8/21以降のログが出ていないようです。この後どのあたりを調べたらよいかご教示いただけますでしょうか

■監視対象サーバのsystemctl status zabbix-agent
● zabbix-agent.service - LSB: Start and stop Zabbix agent
Loaded: loaded (/etc/rc.d/init.d/zabbix-agent; bad; vendor preset: disabled)
Active: active (exited) since Thu 2019-08-22 22:30:59 JST; 13h ago
Docs: man:systemd-sysv-generator(8)
Process: 10496 ExecStop=/etc/rc.d/init.d/zabbix-agent stop (code=exited, status=0/SUCCESS)
Process: 10523 ExecStart=/etc/rc.d/init.d/zabbix-agent start (code=exited, status=0/SUCCESS)

Aug 22 22:30:59 XXXXXX-APP01 systemd[1]: Starting LSB: Start and stop Zabbix agent...
Aug 22 22:30:59 XXX-XXX-APP01 zabbix-agent[10523]: Starting Zabbix agent: [ OK ]
Aug 22 22:30:59 XXX-XXX-APP01 systemd[1]: Started LSB: Start and stop Zabbix agent.

■監視対象サーバのプロセス
ps -ef | grep zabbix
root 30724 27976 0 11:59 pts/0 00:00:00 grep --color=auto zabbix

■監視対象サーバのzabbix_agentd.log
18180:20190821:173453.313 Starting Zabbix Agent [SBC-PRD-APP01]. Zabbix 2.2.23 (revision 83227).
18180:20190821:173453.313 using configuration file: /etc/zabbix/zabbix_agentd.conf
18181:20190821:173453.313 agent #0 started [collector]
18183:20190821:173453.313 agent #1 started [listener #1]
18184:20190821:173453.314 agent #2 started [listener #2]
18185:20190821:173453.314 agent #3 started [listener #3]
18186:20190821:173453.314 agent #4 started [active checks #1]
18186:20190821:173453.380 no active checks on server [10.123.10.251:10051]: host [SBC-PRD-APP01] not found
18186:20190821:173653.456 no active checks on server [10.123.10.251:10051]: host [SBC-PRD-APP01] not found
18186:20190821:173853.553 no active checks on server [10.123.10.251:10051]: host [SBC-PRD-APP01] not found
18186:20190821:174053.638 no active checks on server [10.123.10.251:10051]: host [SBC-PRD-APP01] not found
18186:20190821:182653.209 cannot stat '/var/log/httpd/error_log': [13] Permission denied
18186:20190821:182654.213 cannot stat '/var/log/httpd/error_log': [13] Permission denied
18186:20190821:182655.217 cannot stat '/var/log/httpd/error_log': [13] Permission denied
18186:20190821:182655.217 active check "log[/var/log/httpd/error_log,@Log Filter httpd]" is not supported
18180:20190821:183740.770 Got signal [signal:15(SIGTERM),sender_pid:21504,sender_uid:0,reason:0]. Exiting ...
18180:20190821:183740.772 Zabbix Agent stopped. Zabbix 2.2.23 (revision 83227).

ユーザー TNK の写真

psコマンドでzabbix_agentdプロセスが無いのですから、Zabbix
エージェントは起動していません。
ログに出力されているように、2019/08/21 16:37:40にZabbixエー
ジェントを停止してそのままのようです。
異常終了したわけではなさそうです。

Zabbixエージェントを起動してください。

あと、httpdのログを監視しようとされているようですが、ディレ
クトリやファイルのパーミッションを確認してください。
現在の設定のままでは、パーミッションエラーが発生して監視で
きない状態のようです。

ユーザー yukiko の写真

以下のコマンドを投げて、エージェントの起動を試み、以下の様に[OK]とでています。
これ以外に、エージェントを起動する方法はあるでしょうか?
sudo service zabbix-agent start
Starting zabbix-agent (via systemctl): [ OK ]

ユーザー TNK の写真

Amazon Linux 2を使用されているのであれば、systemdを使用して
いたはずですので、Amazon Linux 2用に適した環境設定をしていれ
ば、以下のコマンドで起動します。

$ sudo systemctl start zabbix-agent

設定によっては、書かれていたようなserviceコマンドでも起動で
きるでしょう。

yukikoさんが、どのようにして環境を構築されたのかわからないの
で、どの方法が最適なのかは判断できません。

ユーザー yukiko の写真

何度もすみません。

確認したところ、通常であれば、/var/run/zabbix/zabbix_agentd.pidが存在するはずですが、これが存在していませんでした。

このファイルが存在しないことで、うまく起動できないのではないかと推測しています。
このファイルはどのように作成すればいいのでしょうか?

今回インストールしたパッケージは以下の通りです。linux2でインストールすべきパッケージとして誤りであれば、推奨を教えていただけますでしょうか?
rpm -qa | grep zabbix
zabbix-release-2.2-1.el6.noarch
zabbix-agent-2.2.23-1.el6.x86_64
zabbix-2.2.23-1.el6.x86_64

ユーザー TNK の写真

確認したところ、通常であれば、/var/run/zabbix/zabbix_agentd.pidが存在するはずですが、これが存在していませんでした。

このファイルが存在しないことで、うまく起動できないのではないかと推測しています。
このファイルはどのように作成すればいいのでしょうか?

Zabbixエージェントを起動したときに自動的に作成されます。

今回インストールしたパッケージは以下の通りです。linux2でインストールすべきパッケージとして誤りであれば、推奨を教えていただけますでしょうか?

Amazon Linux 2を使用されているのですよね?
そうであるならば、RHEL 6用を使用するのは誤りです。
インストール時にエラーや警告は出ませんでしたか?

どちらかといえば、RHEL 7用を使用したほうがまだ正常に稼働する
可能性があるのですが、細かなライブラリのバージョンが異なる場
合があるようですので、Amazon Linux 2上でビルドしなおしたエー
ジェントを使用することをお勧めしています。

ユーザー yukiko の写真

ありがとうございます。RHEL 7用をインストールしなおしたところ、プロセスが起動するようになりました。