日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

ログ監視での検知対象絞り込み

現在、下記のような設定をし、ERRORが含まれる全メッセージを検知対象としている。
※他のログ監視のアイテム/トリガも同じ<トリガアクション>を使用している。

---------------------------------
<トリガアクション>
 ■アクションの実行条件(①and(②or③or④or⑤))
 ①トリガーの値:障害
 ②トリガーの深刻度:致命的な障害
 ③トリガーの深刻度:重度の障害
 ④トリガーの深刻度:軽度の障害
 ⑤トリガーの深刻度:警告

 ■アクションの実行内容
 メール送信

<トリガ>
({OpenStack_Compute:log[/var/log/nova/nova-compute.log,ERROR].nodata(600)}=0)
and ({OpenStack_Compute:log[/var/log/nova/nova-compute.log,ERROR].iregexp(ERROR)}<>0)
---------------------------------

パイロット運用し始めて、実際に通知されるERRORメッセージの中に障害として扱う必要がない
ものがあり、除外したいと思ってます。

除外したい文字列「ABCD」が含まれるERRORを検知対象外としたい場合、

テンプレートに登録できるホストの数の制限について

いつもお世話になっております。

【当方の環境】CentOS6.6
       zabbix 2.4.3

NW機器を監視するために、NW機器監視用のテンプレートを作成し、そのテンプレートで監視したいホストを
そのテンプレートにリンクさせて行くと、1001ノードまでは登録できてそれ以降はテンプレートの更新が正常に
終了しますが、実際1002個目のノードが登録されません。
該当のホストを見ると、テンプレートのリンクはされていませんが、テンプレートに登録していたアイテムなどは
そのホストのアイテムに登録されています。
テンプレートのリンクがされないだけのようです。

※数え方が悪く1001ではないかもしれません、ホストグループも10個程度登録表示されていますが、ホストの
数としては、1001個くらいまでOKです。

テンプレートにリンクできるホストの数に制限があるのでしょうか?

以上、よろしくお願いいたします。

Windows_Zabbixエージェントの2重化について

いつもお世話になっております。

ある要件により、
独立したZabbixサーバを2台立てて、
監視対象となるWindowsServer2008でZabbixエージェントを2つ起動し、
それぞれの別のZabbixサーバと通信が可能か検討しております。
 →通常、Zabbixサーバ2台構成なのであれば、
  Zabbixエージェントのconfに、Zabbixサーバ2つを記載すればOKかと思いますが、
  今回の要件的にNGでした。

実際に動くかどうかの検証を行うため、
現在、何をしなければならないかを考えている最中ですが、
今のところ思い当たるのは以下の項目ぐらいでした。
 ・Zabbixエージェントを2重で動かす方法検討
 ・Zabbixエージェント2つ目の通信ポート変更(?)

断片でも良いので実施しなければいけないと思われる項目に心当たりがありましたら
教えて頂きたく。

※ZabbixVerは2.4系を想定しております。

特定の条件下でActionを実行したい

識者の皆様

何時も勉強をさせて頂いています
今回、zabbixのwebシナリオがfailした時のみ、pagerdutyを鳴らしたいと考えております

Actionにてpagerdutyへメッセージを設定し、Actionの実行条件に
webシナリオがfailした時のメッセージが含まれた時にActionが実行されるように
設定をしたのですが、上手くpagerdutyと連携がとれません

たぶん、上手くActionの実行条件が設定できてないないのが
原因だと考えているのですが、上手く設定をすることができません

識者の皆様、御教授いただけますと幸いです

よろしくお願いします

Actionの実行条件
ラベル 名前 アクション
A メンテナンスの状態 期間外 メンテナンス
B トリガーの値 = 障害
C トリガー名 含まれる web.test.fail[ホスト名 Http Health Check]

10分間に2件以上ログが出たら障害判定のやり方

いつも参考にさせていただいております。

今回、お客様から題名の通り、10分間に2件以上ログが出たら障害判定をしてほしいと依頼がありました。
そしてログの出力方法が「同じ時間帯に1件または複数のログが出る」とのことです。

私は「トリガー関数のcountで10分間に2件以上検出したら障害判定することができますよ」と提案したら
「同じ時間帯に何件ログが出るかわからないので、その条件だと1回の時間帯で条件を満たしてしま可能性があります。」とのことです。

まとめると、やりたいログ検出方法は以下となります。
①同じ時間帯に出力したログを1件とする(同じ時間帯に1件から複数件出力があるため)
②違う時間帯のログが10分間に2件以上出力された場合、障害とする

この条件でログ監視はできるでしょうか?
ご教授よろしく御願いいたします。

-------------サーバー情報(zabbix共通)-------------
zabbixバージョン2.4.7
サーバーOSCentOS release 6.7 (Final)
----------------------------------------------------

コンテンツ配信