特定サーバの特定アイテムのみ、一時的にタイムアウトで収集不可となる
<事象>
特定サーバの特定アイテムで一時的にタイムアウトで収集不可という事象が発生しており
同じ設定をしている他のサーバでは発生しない為、原因の特定に至らず、アドバイスいただけますと幸いです。
対象アイテム
vfs.fs.size[{#FSNAME},used]
監視間隔:10分
LLDにて各ドライブ(C,D,E,M)を収集しており
C、Dドライブが毎日収集不可が発生
E、Mドライブは問題なく収集される
■Zabbixサーバ構成
バージョン:6.0.20
zabbix_server.confのtimeout値:30
■監視サーバ構成
OS:Windows Server 2012 R2
Zabbix Agent2のバージョン:6.0.13
zabbix_agent2.confのtimeout値:30
■Zabbixサーバログ
2752008:20240711:222016.553 item "ホスト名:vfs.fs.size[C:,used]" became not supported: operation on mount 'C:' timed out
2752008:20240711:222016.553 item "ホスト名:vfs.fs.size[D:,used]" became not supported: operation on mount 'D:' timed out
2752008:20240711:223012.284 item "ホスト名:vfs.fs.size[C:,used]" became supported
2752008:20240711:223018.322 item "ホスト名:vfs.fs.size[D:,used]" became supported
■Zabbixエージェントログ
2024/07/11 22:20:13.203577 check 'vfs.fs.size[C:,used]' is not supported: operation on mount 'C:' timed out
2024/07/11 22:20:15.709746 check 'vfs.fs.size[D:,used]' is not supported: operation on mount 'D:' timed out
TNK - 投稿数: 4755
対象のサーバーのみ処理能力が不足しているが、デバイスの情報取
得に時間がかかっているのではないでしょうか?
イベントログなどにデバイスに対するエラーやリトライが記録され
ていたりしませんか?
対処策としては、ZabbixサーバーとZabbixエージェントのタイム
アウトの時間を延長することをご検討ください。
SR - 投稿数: 3
ご回答ありがとうございます。
vmware ESXi上の仮想マシンでして、該当時間帯にスナップショットを取得していることから
イベントログに以下のエラーが記録されてますが、問題ない事象と認識してます。
https://knowledge.broadcom.com/external/article?legacyId=2092793
ソース:disk
イベントID:157
内容:ディスク 4 が突然取り外されました。
タイムアウト値についてですが、最大30秒の認識ですが
それ以上に設定することは可能なのでしょうか?
TNK - 投稿数: 4755
Zabbix 6.0であるならば、30秒が最大です。
それ以上に設定することはできません。
SR - 投稿数: 3
スナップショット取得と監視が重ならないように
監視間隔を設定して回避しようと思います。
ご回答ありがとうございました。