ログ監視の復旧条件
過去のフォーラム検索した限り同じものがなかったように思えたので質問させてください。
ログ監視にて以下のようなログを監視しています。
やりたい事を最初に伝えると最初の5文字が端末名で最後のコードでアップとダウンを
判別していますが、障害と復旧をログ監視で出来るかと方法があれば助言頂きたいです。
ログ
AA111,yyyyMM/dd hh;mm;ss,0210D210 ←①
AA112,yyyyMM/dd hh;mm;ss,0210D200 ←③
AA111,yyyyMM/dd hh;mm;ss,02100200 ←②
AA112,yyyyMM/dd hh;mm;ss,02100210 ←④
AA113,yyyyMM/dd hh;mm;ss,0210D200 ←⑤
AA113,yyyyMM/dd hh;mm;ss,02100200 ←⑥
ログの説明
最初のカラム 例(AA111)が端末名で、3つ目のカラムのコードの5個目Dがダウンを示しています。
別の行のコードの5個目が0はアップを示しています。
①③⑤障害
②④⑥復旧
端末名の種類は数百あります。
ログはPCで加工して出力しているものなので並び替えは可能です。
上記のログで「端末名①」のDのダウンを障害、5個目の0のアップを復旧としたいのですが、
ZABBIXで先頭の端末名を保持するような動作は可能でしょうか。
サーバが3.4 エージェントが3.2.4(WINDOWS)になります。
現状はその行にDがあればトリガーで障害として検知しているだけですが、
対象の端末名でDが0に変化したことを復旧トリガーにしたいと考えてます。
恐縮ではございますが、可能でしたら助言頂ければ助かります。
karna - 投稿数: 61
> ZABBIXで先頭の端末名を保持するような動作は可能でしょうか。
一つのトリガーで、たとえば、
「 ホストAは障害、ホストBも障害→ホストAは障害、ホストBは復旧→復旧通知は出すが、ホストAは障害のままなのでトリガーは障害のまま」
という動作には対応していません。
ホストごとに状態を把握したいのであれば、
・各ホストにログを置いて、それぞれ監視する。(それぞれのホストに、エージェントが必要)
・トリガーをホスト分作成する。
いずれか、あるいは組み合わせて設置します。
なお、トリガーを分けたとしても障害を検知するのは、トリガーを設置したホストになるので、マップやダッシュボード等で把握したいのであれば、
可能な限り、各ホストで監視するようにします。
bochimeshi - 投稿数: 8
ご考察ご解答ありがとうございます。
ドキュメント、ブログを読み漁ってたところ従来のバージョンでは、
確かに全部解決済みになってしまうところ、
3.2移行に実装されているイベントタグを使うと、トリガーでアイテムの内容を細分化と出来、
UPとDOWNなどを条件にして解決済みにできるようになったとのこと試したら何とかうまくいきました。
ひとまずクローズでお願い致します。
この場質問させて頂きありがとうございました。