日本Zabbixユーザー会フォーラム

Zabbixソフトウェアのインストール、設定、監視設定、バグ報告に関する質問。日本Zabbixユーザー会のサイトやその他の質問もこちら。

ログ監視の復旧通知メールの出力内容について

Ver:Zabbix Server 3.4.13
OS:Alpine Linux v3.4.6

お世話になります。
タイトルの件、ご教授頂きたく宜しくお願い致します。

■検出したエラーメッセージ
エラーメッセージA
エラーメッセージB

ログ監視において、トリガーの障害イベント生成モードを「複数」に設定して
一度に複数のエラーレコードを検出した場合、1レコード毎にアクション
(障害メール通知)を実行するようにしております。

またアクションの実行内容:デフォルトのメッセージでは下記のように設定して
各アクション(障害メール通知)にて別々のエラーメッセージを出力するように
しております。

■実行内容のデフォルトのメッセージ設定
-------------------------------------
発生日時: {EVENT.DATE} {EVENT.TIME}
トリガー名: {TRIGGER.NAME}
ホスト名: {HOST.NAME}({INVENTORY.NAME})
重大度: {TRIGGER.SEVERITY}
メッセージ:エラーレコードを検出しました。
検出したレコード:{HOSTNAME}:{ITEM.VALUE}
-------------------------------------

ZABBIXの画面上にSNMPトラップのメッセージが出力されない件について

お世話になっております。

標題の件、過去のフォーラム等を参考にSNMP Trap設定を
行いましたが、/varlog/messagesと/var/log/snmptt.logへのtrap出力は確認できましたが、
zabbix webUI上でtrap内容が出力されず、有識者の方のアドバイスをいただければと思います。

zabbix server 3.0.22

以下のフォーラムとリンクを参照し、SNMP Trapを設定しました。
■過去フォーラム
ZABBIXの画面上にSNMPトラップのメッセージが表示されない
SNMP Trapの受信について

また、以下を参照にmibがコンバートできる事を確認しています。
※参考URL同様にIF-MIBをコンバートし所定のディレクトリに配置しました。
https://www.slideshare.net/qryuu/zabbix20snm-ptt

下記の通りアイテムを登録しました。
アイテム名:Trap TEST
キー:snmptrap[regexp]
タイプ:SNMPトラップ
データ型:ログ
ログの表示形式:hh.mm.ss yyyy/MM/dd
※snmptt.confの設定内容と合わせています。
※また、ホストsnmpiインターフェースの設定も行っています。

ping監視のキューがたまってしまう現象

お世話になっております。

今回、ping監視のキューがたまってしまい解決策を模索しているのですが
中々解決に至らないので投稿させていただきます。

~環境~
CentOS 7.3
MariaDB 5.5
Zabbix 3.4

監視ping監視しているホスト数は40台で全体の有効アイテム数は953
一秒当たりの監視項目数は11.94です。

ping監視のキューがたまっている事象の記事を見てzabbix_server.confの
StartPingerの値やStartPollerなどの設定を変更し、再起動しても改善が
見られていません。以下にアイテムとserver.confの設定値を記載します。

~ping監視~
icmpping[,3,300000,68,3000]

~zabbix_server.conf~
StartPollers=10
StartPingers=30
CacheSize=32M
CacheUpdateFrequency=120
StartDBSyncers=8

zabbix_server.confについては自身と同様な現象の解決した際の記事を
参考に設定を変更してみました。

※追記
Template App Zabbix Serverのテンプレートは適用して

web監視 web.test.timeを使ったトリガー

お世話になっております。

zabbix3.4
サーバもエージェントもRHEL7に居ます。

二点あります。

ひとつめ
30秒間レスポンスがなければタイムアウトと見なして障害とする
みたいなトリガーを設定したいです。

{ホスト名:web.test.time[シナリオ名,ステップ名,resp].last()}>30
{ホスト名:web.test.time[シナリオ名,ステップ名,resp].count(#30,0,"gt")}>0

上記二つ試してみましたが動かないので
どこがおかしいのか教えていただきたいです。
認証は今は設定していないですが、これからベーシック認証になるかもしれないです。

ふたつめ
web.test.timeとweb.test.failを使って監視をしていますが
この二つの使い分けがいまいちピンときません。
何か決定的な違いがあれば教えていただけないでしょうか。

よろしくおねがいします。

Zabbix 4 でのアクションに関して

フォーラムにはいつもお世話になっております。

Zabbix 3.0.5で稼働している環境を 4.0.0に移行するための検証を行っています。

Zabbix 4.0.0 にDBが更新されたときのログに、下記が記載されました。
Action "ZABBIXサーバー稼働" condition "Trigger value = OK" will be removed during database upgrade: this type of condition is not supported anymore

アクションで設定を確認したところ、トリガーの値という条件が無くなり、設定ができなくなっていました。

Zabbixサーバが稼働していることを確認するメールを送信するため、下記のトリガーを設定し、アクションでトリガーの値が正常な時に、メールを30分に一回送信する設定をしていました。
{Zabbix Server:proc.num[zabbix_server].last(0)}<1
and {Zabbix Server:proc.num[zabbix_server].nodata(120)}=0

アクションでトリガー状態という条件が無くなり、障害時は実行内容タブの設定が実行され、復旧時は復旧時の実行内容タブの内容が実行されるようになったようです。

コンテンツ配信