アイテムを同時取得した際にアイテム取得が出来ない
お世話になります。
掲題の件、Zabbixの挙動についてご教授頂きたく投稿します。
■発生現象
当方で管理しているHTTPSサイト(約30サイト)に対してSSL証明書の有効期限を監視すべく
外部チェックにてZabbix Server上に配置したスクリプトを実行し、値を取得しています。
実行タイミングとしては定期設定で毎朝9時に設定しています。
その際、約30サイトのうち、大半の情報は取得できていますが、一部のサイトで情報が取得できません。
取得できないサイトは特定サイトではなく、日によって異なります。
Zabbix内部の動作として、定期設定時にはこのような現象は起こり得るのでしょうか。
運用管理上、Zabbix Serverのバージョンアップは難しいためこのバージョン特有の事象であれば、
定期設定を利用しない方向で調整しようと考えています。
※Zabbix ServerのTimeout値は最大値の30秒に設定しています。
■Zabbix Server情報
OS:Cent OS 6.7
CPU:4GHz Equivalent(Xeon 2007)×1
RAM:7.5GB
Zabbix Server バージョン:3.0.7
TNK - 投稿数: 4671
恐らくタイムアウトが発生しているのだと思われますが、Zabbixサ
ーバーのログを確認してみてください。
問題が発生しているのであれば、何らかのログが出力されていると
思います。
rymk - 投稿数: 9
TNK様
ご回答ありがとうございます。
Zabbixサーバのログ(デバッグレベルは3です)で、タイムアウトが発生したログは出力されていませんでした。
※試しに、手動でスクリプトを実行してみたところ、遅くとも5秒以内にはレスポンスがありました。
ログに出力されないとなると考えられる原因の可能性として何か挙げられますでしょうか。
ざっくりした質問となってしまい大変申し訳ありません。。。
TNK - 投稿数: 4671
アイテムの値が取得できていないのであれば、対象のホストのアイ
テム一覧の右側に赤いアイコンが表示されているはずです。
そのアイコンにマウスのポインタを移動させてポップアップされる
メッセージを確認してみてください。
rymk - 投稿数: 9
ご回答ありがとうございます。
私も取得した値の型が違う等のエラーが発生し、取得不可になっているのかと思い確認はしたものの、
特にアイコンは出ておりませんでした。
となると、Zabbixの問題ではなく作成したスクリプトが原因かと思い、
スクリプトの動作結果をログ出力するよう設定したところ、特定のサイトに対して何度もリトライをしているような動作が見受けられました。
その特定のサイトは、現在稼動しておらず、アイテム設定も有効のままであったため、
このリトライに引きずられて取得すべきアイテムが取得されていない可能性があります。
一旦、このリトライされているサイトのアイテム設定を無効にし、様子見してみることにします。
ご丁寧に対応いただきましてありがとうございました。
TNK - 投稿数: 4671
処理に長時間かかるようなアイテムがあった場合、同じ種類のアイ
テムの値を取得するのが遅れる場合があります。
Zabbixのキューの状態や、Zabbixサーバーの各プロセスのbusy状態
を確認して、busyが多く発生しているプロセスに関しては、起動時
のプロセス数を増やすことで、同時に処理できるアイテムの数を増
やせる場合がありますので、それらも考慮して調整されるとより良
いと思います。
rymk - 投稿数: 9
TNK様
スクリプト実行時のログの出力方法を調整し、
ご教授頂いた内容を確認したいと思います。
アドバイス、ありがとうございます。