proc.num[vsftpd]で取得しているプロセス監視のアイテム値が歯抜けになってしまう

お世話になります。

以下の環境で、vsftpdのプロセス監視を行っているのですが、
いままで取得できていたでプロセス数が取得できず、アイテムの取得値が歯抜けになってしまう現象が発生しています。

監視対象のサーバにログインして、vsftpdのプロセスを確認すると、
プロセス自体は立ち上がっており、何かが原因でZabbix側でアイテムの取得がうまくいっていないのではないかと
考えているのですが、明確な原因がわかっておりません。

<環境>
【Zabbixサーバ】
OS:Amazon Linux AMI release 2016.03
ZabbixServerバージョン:zabbix-server.x86_64 2.2.13-1.el6
vsftpdプロセス監視アイテムキー:proc.num[vsftpd]

【Zabbixクライアント】
OS:Amazon Linux AMI release 2016.09
ZabbixAgentバージョン:zabbix-agent.x86_64 2.2.17-1.el6

プロセス数が取得できなくなったタイミングのログを確認したところ、
サーバ側、Agent側ともにvsftpdプロセス監視アイテムに関連する
ログは出力されていませんでした。

またZabbixのWeb画面より[管理]-[キュー]を確認したところアイテムの遅延も発生しておりませんでした。

zabbixについて有識者がおらず、明確な原因について検討がついておりません。
有識者の方、また同様の経験がある方、どのように調査・修正すれば
事象の解決が行えるかご教示いただけないでしょうか。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー heya の写真

歯抜けというのは、一時的に値が取得できなくなり、何もしなくてもしばらくしたらまた取得できるようになる、ということですか?
それと、念のためですが、取得できないというのは「0 になっている」というわけではないのですよね?

>どのように調査・修正すれば
とりあえず、次の二点を確認してみてください。
・取得できない(=取得不可)ときは、設定のアイテム一覧の画面で、右の方(エラーの欄)に赤の×印が出るはずです。そこにマウスカーソルを持っていくとエラー内容が表示されますが、そこには何と書いてあるでしょうか?
・取得できないときに zabbix_get を使って手動で取得してみるとどうなりますか?

ユーザー hal21633 の写真

heyaさま

ご返信ありがとうございます。

>歯抜けというのは、一時的に値が取得できなくなり、何もしなくてもしばらくしたらまた取得できるようになる、ということですか?
>それと、念のためですが、取得できないというのは「0 になっている」というわけではないのですよね?
その通りの認識であっております。
0であればグラフで確認した際、線が繋がると思いますが、
今回のケースではその間だけ、グラフの線が切れている状態となっております。

現在、既にプロセス数の取得ができるようになっておりますので、
アイテム欄のエラー欄での確認やzabbix_getの確認は行えません。
事象が再現した際、確認いたします。

今回、値が取得できなくなった際の調査方法につきまして
ご案内いただきましたが、事象回復後の調査方法となるとやはり難しいものなのでしょうか。

ユーザー TNK の写真

本来であれば、何らかのログが出力されると思うのですが、ログが
何も出力されていないとなると、その現象が発生した状況で何が起
こっているのか再現してみないことには問題を特定することができ
ません。

取得できない時間帯に傾向があるのであれば、その時間帯のCPUの
負荷状況など、他のリソースの状態も確認してみてください。

負荷があがっている時に取得できない傾向があるのであれば、可能
性としては、値取得の処理のタイムアウトが発生している可能性が
あります。
# この場合もログが残るはずなのですが.....。

もしも、タイムアウトが発生してしまっているのであれば、Zabbixサ
ーバーとZabbixエージェントの両方の設定ファイル内にあるTimeout
の値を大きくすることで改善する場合があります。