Zabbix unreachable poller processesの内容の確認方法
お世話になっております。
本日は表題の件でご指導頂きたく、投稿させていただきました。
「Zabbix data gathering process busy」のグラフで
「unreachable poller」が常に100%になる状況が発生して、これを
改善したいと考えています。
また上記現象は常時09:00に発生して、その後はzabbix-serverを再起動するまで続きます。
よって24h間隔で実施しているLLDの検出が関係している可能性が高いです。
しかし、上記 pollerの内容が何かを知りたいのですがうまい方法が
見つからず困っています。
debuglevel = 3 → unreachableの内容が確認できるログは見当たりません。
debuglevel = 4 → 監視アイテム数(17万アイテム)が多いため、監視そのものが正常に動かない
元のunreachableの特定は難しそう・・・
そこで、unreachableの内容をログに出力する方法やmysqlのデータから探すなどが考えられそうですが
具体的な方法がわからない状況です。
よろしくお願い致します。
TNK - 投稿数: 4742
unreachable pollerの主な役割は、値が取得できなくなったアイテ
ムに対して再取得を行うために、値の再取得を試みるものであった
と思います。
ログに何らかの値が取得できないとか出力されていたり、キューが
溜まっていたりとかしませんか?
ちなみに、Zabbix 2.4以降だと、特定のプロセスだけのログレベル
を変更できるようになっていたはずなので、ログのレベルをあげる
のをunreachable pollerだけに限定すればログの量は抑えられるか
もしれません。
実行例:
# zabbix_server --runtime-control log_level_increase="unreachable poller"
# zabbix_server --runtime-control log_level_decrease="unreachable poller"
http://blog.zabbix.com/zabbix-2-4-features-part-6-runtime-loglevel-chang...
https://www.zabbix.com/documentation/2.4/manpages/zabbix_server
my404261 - 投稿数: 8
TNK さん
コメントありがとうございます。
> ログに何らかの値が取得できないとか出力されていたり、キューが
> 溜まっていたりとかしませんか?
残念ながらログもキューも無い状況です。
>実行例:
> # zabbix_server --runtime-control log_level_increase="unreachable poller"
> # zabbix_server --runtime-control log_level_decrease="unreachable poller"
まさにこれがやりたかったことです!ありがとうございます。
こんなコマンドがあるのですね。すばらしい。
おかげで異常の処理が特定でき、100%の問題がスッキリ解決しました。
ありがとうございました。
今後ともよろしくお願いいたします。