サーバのハードウェアモニタリング
データセンターにある専用サーバのハードウェアのモニタリングをしようと思っています。
CPUの温度やファンがまわっているかのチェックです。
いろいろ方法があるのですが、よく行われているのはどんな方法なのでしょうか?
今のところ、各サーバにlm_sensors を入れて対応するのが簡単そう(理解しやすい)
のでいいかなと思っていますが、openIPMI を使うのが通常なのでしょうか?
下記を見ると、データ取得だけなら、agent にちょっと設定するなりで簡単に取得できそうな気がしています。
https://www.zabbix.com/documentation/2.2/manual/appendix/items/sensor
ご存知の方いらっしゃいましたら、ぜひよろしくおねがいします。
fripper - 投稿数: 495
当該サーバのハードウェアが、どのような監視をサポートしているかによるとは思います
ハード監視の中で、もっとも汎用的な手法はIPMIではないかと思います
多くのサーバ系ベンダーの機器は、IPMIで動作ステータス値を取れるように
なっているようですので、まずは、IPMIを利用した監視を検討されるのが良いかと思います
また、ベンダーによりますが、lm_sensor 系によるステータス値取得や
SNMPによる値の取得等、異なったやり方になってしまうこともあるかと思います
私個人は、IPMIとSNMPでハード監視値を取得しています
ただ、機器との相性か、zabbixのIPMIエージェントではうまく値が収集できず、
UserParameterから、ipmitool コマンドを叩く形で収集しています
取り方、取れる値の種類、とれた値からどうやって異常と判断するか‥と、
総合的に見ると、ある程度、ハード毎にやりかたを選ばないといけないと思います‥
KAZ - 投稿数: 1085
fripperさん
ただ、機器との相性か、zabbixのIPMIエージェントではうまく値が収集できず、
UserParameterから、ipmitool コマンドを叩く形で収集しています
ipmitoolの名称とZabbixで使う名称一部違ってます。
Zabbixでipmi監視する時は一度Zabbixサーバのログレベル4でipmi監視すると取得可能なsensor名が取れます。
その名称で監視できます。
→この件は改善が上がってます。
尚、1.8と2.2ではipmi監視色々機能追加されているので、ipmi監視するならZabbix2.2をお勧めします。
後、Zabbixのipmi監視ではこんな問題も出てます。
https://support.zabbix.com/browse/ZBX-8188
電源offしてもipmiでsensorの値が取れてしまうという問題です。
→ipmitoolではnaが返却されます。
tadashi - 投稿数: 48
fripper さん レスありがとうございます。
IPMI ですが、専用サーバの場合、設定できるのでしょうか? ベンダーが特定できないので調査中です。
専用サーバのホスティング会社にIPMI可能かどうか? 可能ならどうやって設定するかをたずねています。
最近のは、IPMI対応できるようですが、古いのはちょっと難しいようです。
それで、とりあえず、lm_sensors で、CPUの温度と、FANの回転数をとっています。
閾値ですが、よくわからないので、トリガーは設定せず、グラフ化してみるだけで対応しています。
---- 追記 ---
http://kometchtech.blog45.fc2.com/blog-entry-1157.html
この件にぴったりのサイトありました。
lm_sensors 使うときには参考になります。