ping監視について
お世話になっております。
本日、以下環境のzabbixサーバの再起動を実施したところ、
サーバで監視している全てのハードウェアのping監視でメッセージが出力されました。
===================
CentOS 7.6
zabbix sever 4.2.3
===================
最新データやグラフで確認してみても一度も通信が途切れたようには見えません。
また、今回のサーバ再起動の1週間前に他環境同一設定のzabbixサーバの再起動を実施しましたが、
その際は何もメッセージが出力されませんでした。
アイテム、トリガー設定は以下の通りです。
==========================================
アイテム
icmppin[,3,,,3000] 監視間隔60秒
トリガー
{テンプレート名:アイテム名.last(3)}<>1
==========================================
何が原因で事象が発生したのかご教授いただけると幸いです。
Yasumi - 投稿数: 372
{テンプレート名:アイテム名.last(3)}<>1とありますが、
{テンプレート名:icmpping[,3,,,3000].last(#3)}<>1 ということでしょうか。
ama - 投稿数: 58
Yasumi様
× {テンプレート名:icmpping[,3,,,3000].last(#3)}<>1
○ {テンプレート名:icmpping[,3,,,3000].last(3)}<>1
構築から引き継いだ時点で上記の設定でした。
Yasumi - 投稿数: 372
アイテム「icmpping[,3,,,3000]」は、3パケット中1パケットが返される場合は1を返す、
かつ3000msを越えた場合はタイムアウトになっています。こういう設定は初めて見ました。
すべてタイムアウトした際に0を返すのか、経験がないので分からないですね。
トリガー「.last(3)}<>1」のような設定は不正確な記述であり、無視されます。
実質的には「.last(#1)}<>1」と同様の設定になっていますので、修正したほうが良いと思います。
https://www.zabbix.com/documentation/2.2/jp/manual/appendix/triggers/fun...
「最新データやグラフで確認してみても一度も通信が途切れたようには見えません」とありますが
タイムアウトしていなかったかは再度確認する必要があるかと思います。
また、Zabbixの再起動の仕方によっては誤動作することもあると思います。
上記のような誤作動を防止するために、私は下記のようなトリガー設定を使っています。
{テンプレート名:icmpping.count(#2,0,"eq")}>1
ama - 投稿数: 58
Yasumi様
> 「最新データやグラフで確認してみても一度も通信が途切れたようには見えません」とありますが
> タイムアウトしていなかったかは再度確認する必要があるかと思います。
→タイムアウトしているかどうかの確認はzabbixコンソール上から確認することが出来るのでしょうか。
トリガーについては、ご提示いただいたトリガーを参考に修正を検討いたします。
Yasumi - 投稿数: 372
「最新データ」の「値」が、監視間隔通りに情報取得されていれば、アイテムは正常に機能していたことになります。
逆に監視間隔通りに情報取得されていなかったら、何かしらの問題があったと推測できます。
ama - 投稿数: 58
「最新データ」の「値」が、監視間隔通りに情報取得されているように見えるので、
アイテムは正常に機能していたと思われます。
設定不備のあるトリガーと再起動時の誤作動が原因と思われるので、
まずは、設定不備のトリガーの修正から取り掛かろうかと思います。