SMTPプロセスの監視

初めまして。

以下の設定で、SMTPプロセスの監視を行っています。

Zabbix Server:
OS:CentOS Linux release 7.5.1804 (Core)
# /usr/sbin/zabbix_server -V
zabbix_server (Zabbix) 3.0.14
Revision 76338 27 December 2017, compilation time: Dec 27 2017 16:18:17

Copyright (C) 2017 Zabbix SIA
License GPLv2+: GNU GPL version 2 or later .
This is free software: you are free to change and redistribute it according to
the license. There is NO WARRANTY, to the extent permitted by law.

Trigger:
親トリガー:Template App SMTP Service
名前   :SMTP service is down on {HOST.NAME}
条件式  :{MailGroupWare:net.tcp.service[smtp].max(#6)}=0

Zabbix Agent:
OS:CentOS release 6.9 (Final)
# zabbix_agentd -V
Zabbix Agent (daemon) v2.4.8 (revision 59539) (20 April 2016)
Compilation time: May 4 2016 01:36:20
#

しかし、以下の様にsmtpdのプロセスが走っているにも関わらず、
SMTPサービスダウンのメールが発信されます。

postfix 29351 32463 0 10:42 ? 00:00:00 smtpd -n smtp -t inet -u -o stress= -s 2
postfix 31938 32463 0 10:50 ? 00:00:00 smtpd -n smtp -t inet -u -o stress= -s 2

その時、Zabbix Serverからzabbix_getコマンドを入れると、「0」
のステータスが返ってきます。

# zabbix_get -s xxx.xxx.xxx.xxx -p 10050 -k net.tcp.service[smtp]
0

もう一台、OSもZabbix Agentのバージョンも同じサーバがあり、
zabbix_agentd.confもhostname以外は全く同じですが、こちらは
問題ありません。

何が原因か分からない状況です。

ここを調べた方が良いというアドバイスがあれば、お願い出来ませんでしょうか?

よろしくお願いいたします。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

net.tcp.service[smtp]というアイテムキーは、SMTPのプロセスが
起動しているかを確認するためのものではありません。
Zabbixエージェント経由であれば、ZabbixエージェントからSMTP用
のポート番号に接続できるかをチェックするためのものです。

使用されているSMTPサーバーが、どのようなIPアドレスとポート番
号で接続を受け付けるよう設定されて稼働しているかを確認してく
ださい。

ユーザー networker の写真

ご回答、ありがとうございます。

>使用されているSMTPサーバーが、どのようなIPアドレスとポート番
>号で接続を受け付けるよう設定されて稼働しているかを確認してく
>ださい。

postfixのmain.cfには、以下の様に記述してあります。

mynetworks = 127.0.0.0/8, 192.168.0.0/16, 10.10.10.0/24

デフォルトではIP=127.0.0.1,Port=25と言う事で、正しい
でしょうか。

ちなみに、以下のコマンドでも、返り値が1になったり0に
なったりします。

zabbix_get -s xxx.xxx.xxx.xxx -p 10050 -k net.tcp.service[smtp,xxx.xxx.xxx.xxx,25]

よろしくお願いいたします。

ユーザー masak の写真

>デフォルトではIP=127.0.0.1,Port=25と言う事で、正しい
> でしょうか。
→SMTPサーバのIP及びポートは違うと思います。

>ちなみに、以下のコマンドでも、返り値が1になったり0に
> なったりします。
→TNK様の解説にあるとおりなので、そのコマンドの返り値は0になったり1になったりします。ということです。

ユーザー TNK の写真

net.tcp.service[smtp]というように、IPを明記しないで呼び出す
場合は、127.0.0.1(ローカルループバックのIP)を使用して確認を
行います。
※ ソースの src/libs/zbxsysinfo/simple/simple.c 等参照

特定のIPのみを指定して接続許可をするような設定にしている場合
は接続できませんが、接続できる時もあるようですので、特にロー
カルからの接続に制限はつけていらっしゃらないのでしょう。

→TNK様の解説にあるとおりなので、そのコマンドの返り値は0になったり1になったりします。ということです。

0になったり1になったり呼び出すたびに頻繁に変わるような状態で
あった場合は、不安定な状態になっていると思われます。

接続できない理由として、接続した状態のコネクションが多くてそ
れ以上接続できないとか、ファイルディスクリプタが不足していた
りするなどいくつかの原因が考えられますが、それらは、postfix
やOS自体のログにも何らかの情報が出力されているはずだと思いま
す。