サーバのハードウェアモニタリング

データセンターにある専用サーバのハードウェアのモニタリングをしようと思っています。

CPUの温度やファンがまわっているかのチェックです。
いろいろ方法があるのですが、よく行われているのはどんな方法なのでしょうか?
今のところ、各サーバにlm_sensors を入れて対応するのが簡単そう(理解しやすい)
のでいいかなと思っていますが、openIPMI を使うのが通常なのでしょうか?

下記を見ると、データ取得だけなら、agent にちょっと設定するなりで簡単に取得できそうな気がしています。
https://www.zabbix.com/documentation/2.2/manual/appendix/items/sensor

ご存知の方いらっしゃいましたら、ぜひよろしくおねがいします。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー fripper の写真

当該サーバのハードウェアが、どのような監視をサポートしているかによるとは思います

ハード監視の中で、もっとも汎用的な手法はIPMIではないかと思います
多くのサーバ系ベンダーの機器は、IPMIで動作ステータス値を取れるように
なっているようですので、まずは、IPMIを利用した監視を検討されるのが良いかと思います

また、ベンダーによりますが、lm_sensor 系によるステータス値取得や
SNMPによる値の取得等、異なったやり方になってしまうこともあるかと思います

私個人は、IPMIとSNMPでハード監視値を取得しています
ただ、機器との相性か、zabbixのIPMIエージェントではうまく値が収集できず、
UserParameterから、ipmitool コマンドを叩く形で収集しています

取り方、取れる値の種類、とれた値からどうやって異常と判断するか‥と、
総合的に見ると、ある程度、ハード毎にやりかたを選ばないといけないと思います‥

ユーザー KAZ の写真

fripperさん


ただ、機器との相性か、zabbixのIPMIエージェントではうまく値が収集できず、
UserParameterから、ipmitool コマンドを叩く形で収集しています

ipmitoolの名称とZabbixで使う名称一部違ってます。
Zabbixでipmi監視する時は一度Zabbixサーバのログレベル4でipmi監視すると取得可能なsensor名が取れます。
その名称で監視できます。
→この件は改善が上がってます。

尚、1.8と2.2ではipmi監視色々機能追加されているので、ipmi監視するならZabbix2.2をお勧めします。

後、Zabbixのipmi監視ではこんな問題も出てます。
https://support.zabbix.com/browse/ZBX-8188

電源offしてもipmiでsensorの値が取れてしまうという問題です。
→ipmitoolではnaが返却されます。

ユーザー tadashi の写真

fripper さん レスありがとうございます。
IPMI ですが、専用サーバの場合、設定できるのでしょうか? ベンダーが特定できないので調査中です。
専用サーバのホスティング会社にIPMI可能かどうか? 可能ならどうやって設定するかをたずねています。
最近のは、IPMI対応できるようですが、古いのはちょっと難しいようです。

それで、とりあえず、lm_sensors で、CPUの温度と、FANの回転数をとっています。

閾値ですが、よくわからないので、トリガーは設定せず、グラフ化してみるだけで対応しています。

---- 追記 ---
http://kometchtech.blog45.fc2.com/blog-entry-1157.html
この件にぴったりのサイトありました。

lm_sensors 使うときには参考になります。