データ「取得不可」をエラーとするトリガーの設定方法について

いつも拝見させていただいております。fukumaruと申します。

データ「取得不可」をエラーとするトリガーの設定方法についての質問になります。

環境は以下のとおりです。
OS:debian etch
zabbix:1.6.8系
mysql:5.0系
監視対象サーバ:poweredge 1750
使用Raid controller:PERC 4/Di

現在、DellサーバのHD監視をsnmp経由で行っております。最近、Raid1+ホットスペアー(HD3本)のサーバのHD1本が壊れてしまったのですが、Raid Controllerが障害HDを切り離したようで、zabbixから見てデータが「取得不可」となりました。「取得不可」になったデータのMIBとコマンド結果は以下のとおりです。

<blockquote>
#snmpget -On -c community_name -v 1 localhost 1.3.6.1.4.1.674.10893.1.20.130.4.1.4.1
Error in packet
Reason: (noSuchName) There is no such variable name in this MIB.
Failed object: .1.3.6.1.4.1.674.10893.1.20.130.4.1.4.1
</blockquote>

アラート用のトリガーで、last(0)#3 & last(0)#1 としていたのですが、「取得不可」となってしまったため、エラーメッセージが送信されませんでした。そこでトリガーを変更しようと考えておりますが、設定方法が分からず困っております。(マニュアルを読んで、nodata(60)=1を試しましたがうまくいきませんでした。)
申し訳ありませんが、「取得不可」をアラートとして上げる方法をお教えいただけないでしょうか?

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー KAZ の写真

fukumaruさん

仕組み的にzabbixですが、アイテムでの情報が取得できない項目はトリガーで検知できません。

dellのサイトで見ると「1.3.6.1.4.1.674.10893.1.20.130.4.1.4」がarrayDiskStateとなっていますが、「1.3.6.1.4.1.674.10893.1.20.130.4.1.4.1」はHDD1のarrayDiskStateでしょうか?

その場合、下記の値はどうなっていますか?
1.3.6.1.4.1.674.10893.1.20.130.4.1.4.2
1.3.6.1.4.1.674.10893.1.20.130.4.1.4.3

切り替わった方のHDDの情報は取得できていないでしょうか?
取得できているならばその情報で切り替わったかを判別できないでしょうか?

ユーザー fukumaru の写真

KAZ様 早速の返信ありがとうございます。

>仕組み的にzabbixですが、アイテムでの情報が取得できない項目はトリガーで検知できません。
了解しました。ありがとうございます。

>dellのサイトで見ると「1.3.6.1.4.1.674.10893.1.20.130.4.1.4」がarrayDiskStateとなっていますが、「1.3.6.1.4.1.674.10893.1.20.130.4.1.4.1」はHDD1のarrayDiskStateでしょうか?
ご推察のとおりです。

>その場合、下記の値はどうなっていますか?
>1.3.6.1.4.1.674.10893.1.20.130.4.1.4.2
>1.3.6.1.4.1.674.10893.1.20.130.4.1.4.3
今回はHDD3がホットスペアだったのですが、Ready→Rebuild→Onlineにステータスが変わりましたので今回はこのステータス変更でエラーに気づきました。

>切り替わった方のHDDの情報は取得できていないでしょうか?
>取得できているならばその情報で切り替わったかを判別できないでしょうか?
DELLサーバを多数抱えておりHDDの数やホットスペアの有無もサーバによって違っており、面倒を省くためにテンプレート化して全てのarrayDiskStateのITEMにトリガを設定していました。今の設定では多分ホットスペアが無いサーバのエラーが拾えないと思われます。
snmp trapで検知するなど、zabbixで手軽に監視できる方法をもう少し模索してみます。

話はそれますが、DELLサーバ(perc cerc系)且つsnmp経由でHDD監視されている方は、arrayDiskSmartAlertIndication[1.3.6.1.4.1.674.10893.1.20.130.4.1.31]を監視されると良いと思います。HDDのランプが緑→オレンジ→緑の点滅(HDD劣化警告)を監視できます。zabbix利用者様の何かの参考になればと思います。

ユーザー KAZ の写真

fukumaruさん

※引用タグの設定がおかしかった為、表示がうまくいってませんでした。 1/29修正

>切り替わった方のHDDの情報は取得できていないでしょうか?
>取得できているならばその情報で切り替わったかを判別できないでしょうか?
DELLサーバを多数抱えておりHDDの数やホットスペアの有無もサーバによって違っており、面倒を省くためにテンプレート化して全てのarrayDiskStateのITEMにトリガを設定していました。今の設定では多分ホットスペアが無いサーバのエラーが拾えないと思われます。
snmp trapで検知するなど、zabbixで手軽に監視できる方法をもう少し模索してみます。

snmp trap監視が一番用意かと…
只、計測値をグラフ化とかはできないので、snmptrap監視とsnmp監視と併用すると言う手もありかと。

DISK使用量等の計測はsnmp監視で、DISK障害や死活監視はsnmptrap監視で行うと言う考えもありかと。

話はそれますが、DELLサーバ(perc cerc系)且つsnmp経由でHDD監視されている方は、arrayDiskSmartAlertIndication[1.3.6.1.4.1.674.10893.1.20.130.4.1.31]を監視されると良いと思います。HDDのランプが緑→オレンジ→緑の点滅(HDD劣化警告)を監視できます。zabbix利用者様の何かの参考になればと思います。

情報ありがとうございます。m(__)m
DELLサーバ(perc cerc系)が手元にないので直ぐには試せませんが有効活用させて頂きます。