ヒストリの couldn't resolve host name: Could not resolve host: [ホスト名] について

zabbixでwebサイトのヘルスチェック監視を行っています。
webシナリオで設定したヘルスチェックファイルのURL(http://{HOST.HOST}.domain/filepath)を監視する形です。
なお、トリガーは下記のような設定です:

{テンプレート名:web.test.fail[シナリオ名].count(#3,1)}=3

この時たまにDNS名前解決ができなくなり、ヒストリに掲題の値ログを残しアラートを発報することがあります。
このエラーは一時的なもののようで、最大15-20分ほどで収束します。
上記のエラーが発生した時間帯の当該サーバのアクセスログを見ると問題なく200を返しており、webサイトでの障害はないようでした。

zabbixサーバから(なぜか)一時的に監視対象のホストの名前解決が失敗してしまうだけで、
実際にwebサイトへの影響がないので、アラートが出るのは本意ではありません。

これはトリガーの設定がうまくないでしょうか?
または、名前解決の失敗の発生自体を抑制する方法をとるのが現実的でしょうか?
(zabbixサーバの/etc/hostsに監視対象のサーバを列挙する、 DNSのローカルキャッシュを導入するetc)

ご助言いただけますでしょうか。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー yk_taiko の写真

DNS の名前解決ができなくても問題がなく、ローカルの情報でもWebサイトが見えればokというのであれば、
DNS の障害に影響を受けないように設定してよいのではと思います。

ちなみに、DNS はシステム内のものなのでしょうか?
webサイト(サーバ)自体に問題がなくても、実際に外部からアクセスできない状態になっているなら、
気づけたほうが良いケースもあると考えます。

ユーザー fymartym の写真

ご回答ありがとうございます。

> ちなみに、DNS はシステム内のものなのでしょうか?
内部DNSを利用していて、もともと外からのアクセスが想定されないドメインです。専用のproxyを経由してweb監視を実施しています。
{HOST.HOST}.domain ←これが対象サーバ自体の内部ドメイン名です。

> DNS の障害に影響を受けないように設定
上記のような場合、内部ドメイン名で監視しにいくことをやめた方がよいのでしょうか?
できるだけトリガー設定を煩雑にしたくないと思っているのですが、この場合は難しいでしょうか。

ユーザー yk_taiko の写真

システムの性質にもよると思うので、なんとも言えません。

落ちる可能性があっても DNS を使うのであれば、以下何れかになるかと思います。
  ・頻繁にエラーがあがることを許容する
  ・落ちることを考慮して閾値を多めにとる (実際に落ちたときに気づくのが遅れる)