Zabbix unreachable poller processesの内容の確認方法

お世話になっております。

本日は表題の件でご指導頂きたく、投稿させていただきました。

「Zabbix data gathering process busy」のグラフで
「unreachable poller」が常に100%になる状況が発生して、これを
改善したいと考えています。

また上記現象は常時09:00に発生して、その後はzabbix-serverを再起動するまで続きます。
よって24h間隔で実施しているLLDの検出が関係している可能性が高いです。

しかし、上記 pollerの内容が何かを知りたいのですがうまい方法が
見つからず困っています。

 debuglevel = 3 → unreachableの内容が確認できるログは見当たりません。

 debuglevel = 4 → 監視アイテム数(17万アイテム)が多いため、監視そのものが正常に動かない
           元のunreachableの特定は難しそう・・・

そこで、unreachableの内容をログに出力する方法やmysqlのデータから探すなどが考えられそうですが
具体的な方法がわからない状況です。

よろしくお願い致します。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー TNK の写真

unreachable pollerの主な役割は、値が取得できなくなったアイテ
ムに対して再取得を行うために、値の再取得を試みるものであった
と思います。
ログに何らかの値が取得できないとか出力されていたり、キューが
溜まっていたりとかしませんか?

ちなみに、Zabbix 2.4以降だと、特定のプロセスだけのログレベル
を変更できるようになっていたはずなので、ログのレベルをあげる
のをunreachable pollerだけに限定すればログの量は抑えられるか
もしれません。

実行例:
# zabbix_server --runtime-control log_level_increase="unreachable poller"
# zabbix_server --runtime-control log_level_decrease="unreachable poller"

http://blog.zabbix.com/zabbix-2-4-features-part-6-runtime-loglevel-chang...
https://www.zabbix.com/documentation/2.4/manpages/zabbix_server

ユーザー my404261 の写真

TNK さん

コメントありがとうございます。

> ログに何らかの値が取得できないとか出力されていたり、キューが
> 溜まっていたりとかしませんか?

残念ながらログもキューも無い状況です。

>実行例:
> # zabbix_server --runtime-control log_level_increase="unreachable poller"
> # zabbix_server --runtime-control log_level_decrease="unreachable poller"

まさにこれがやりたかったことです!ありがとうございます。
こんなコマンドがあるのですね。すばらしい。

おかげで異常の処理が特定でき、100%の問題がスッキリ解決しました。

ありがとうございました。

今後ともよろしくお願いいたします。