web監視 web.test.timeを使ったトリガー
お世話になっております。
zabbix3.4
サーバもエージェントもRHEL7に居ます。
二点あります。
ひとつめ
30秒間レスポンスがなければタイムアウトと見なして障害とする
みたいなトリガーを設定したいです。
{ホスト名:web.test.time[シナリオ名,ステップ名,resp].last()}>30
{ホスト名:web.test.time[シナリオ名,ステップ名,resp].count(#30,0,"gt")}>0
上記二つ試してみましたが動かないので
どこがおかしいのか教えていただきたいです。
認証は今は設定していないですが、これからベーシック認証になるかもしれないです。
ふたつめ
web.test.timeとweb.test.failを使って監視をしていますが
この二つの使い分けがいまいちピンときません。
何か決定的な違いがあれば教えていただけないでしょうか。
よろしくおねがいします。
yk_taiko - 投稿数: 184
「ひとつめ」ですが、該当ステップのレスポンスタイムは30秒以上としてZabbixに記録されてますか。
該当ホストのヒストリを確認してみてください。
「ふたつめ」は取れる内容が全然違います。
web.test.time:各ステップのレスポンスタイム
web.test.fail:失敗したステップの番号 (シナリオが全て成功した場合は0)
- https://www.zabbix.com/documentation/3.4/manual/web_monitoring/items
ntmiiiii - 投稿数: 19
yk_taikoさん
回答ありがとうございます。
テストをしていてhttpdをしばらく止めていたのでレスポンスタイムの値はわからないのですが
20分間くらいはwebページは見れない状態にしていて、{xxxx:web.test.fail[シナリオ名].count(#2,1)}=2 は動きました。
ステップのタイムアウトもシナリオの更新間隔も30秒に設定しています。
ntmiiiii - 投稿数: 19
自己解決。。。?
web.test.fail←何かの原因でページが全く表示されないときに発火する
web.test.time←ページは見れるけどロードが遅いときに発火する
web.test.timeのトリガーをテストするためには
「全く見れない繋がらない」ではなく「重くて見れるまでに時間がかかる」な状態を作らないといけない
この認識で大丈夫でしょうか。。?
yk_taiko - 投稿数: 184
【web.test.time】 はレスポンスが無いと値が入らなかったはずなので、その認識で良いと思います。
【web.test.fail】は、ステップを増やした場合には今設定されているトリガーだと動かない可能性がありますよ。
値に何が入るかはマニュアルを見てください。
トリガーが上手く動かないときは、[最新データ] の該当アイテムの「ヒストリ」に
どのような値が入ってきているか(そもそも値が無いのか)を確認してください。
ntmiiiii - 投稿数: 19
yk_taikoさん
ありがとうございます。
いまはステップは一つだけしか設定されていないので
増えることがあれば作り直します。
zabbixの使い方以前の問題かもしれないですが
Response time for stepの値はだいたいいつも50msくらいで、意図的に負荷をかけて遅くしようとしても180msくらいまでしか伸びません
むしろ、1s以上の値を拾ってきたところを見たことがないです。
現状だと、【web.test.fail】だけでいいのではとしか思えないので、
【web.test.time】のトリガーの具体的な使用例やどんなときに役に立つのかご存知の方居たら教えていただけないでしょうか
質問ばかりで申し訳ありません
ntmiiiii - 投稿数: 19
yk_taikoさん
ありがとうございます。
いまはステップは一つだけしか設定されていないので
増えることがあれば作り直します。
zabbixの使い方以前の問題かもしれないですが
Response time for stepの値はだいたいいつも50msくらいで、意図的に負荷をかけて遅くしようとしても180msくらいまでしか伸びません
むしろ、1s以上の値を拾ってきたところを見たことがないです。
現状だと、【web.test.fail】だけでいいのではとしか思えないので、
【web.test.time】のトリガーの具体的な使用例やどんなときに役に立つのかご存知の方居たら教えていただけないでしょうか
質問ばかりで申し訳ありません