cannot connect to proxy "vm-zabbixproxy1": cannot connect to [[IP]:10051]: [110] Connection timed out について

zabbixサーバ
ver 3.0.8
zabbixproxy × 2台
ver 3.2.7

上記環境で2台のプロキシからサーバに対して情報を渡しています
プロキシはパッシブモードで運用しておりアイテムの取得は遅延はあるものの
一応行えています。

zabbixサーバのログに
cannot connect to proxy "vm-zabbixproxy1": cannot connect to [[IP]:10051]: [110] Connection timed out
が頻発してしまうのですが
解消する方法はございますでしょうか?

プロキシには5台のホストを接続しており
全てのホストのzabbixエージェントは両方のプロキシIPをServerに設定しております。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー fripper の写真

Proxy利用構成の場合、ZabbixサーバとZabbixProxyのバージョンを
合わせなければいけません
X.Y.ZのうちX.Yの部分までは完全に一致させる必要があります

Zの部分については必ずしも一致している必要はありませんが
バグFIX等がありますので、できる限り新しいバージョンをお奨めします

ユーザー siki の写真

ご回答ありがとうございます。
一旦別環境で同じ構成のバージョンを合わせたものを
作成してみました。
zabbixserver,zabbixproxyともに
ver 3.0.9
頻発はしないもののやはりたまに(10分に1回程度)下記コネクションエラーが出てしまいます。
このタイムアウトをなくす事は難しいでしょうか?

29900:20170824:092403.329 sending configuration data to proxy "proc1" at "IP", datalen 113455
29900:20170824:092505.537 sending configuration data to proxy "proc1" at "IP", datalen 113455
29900:20170824:092520.625 sending configuration data to proxy "proc2" at "IP", datalen 2698
29900:20170824:092742.976 cannot connect to proxy "proc2": cannot connect to [[IP]:10051]: [110] Connection timed out
29900:20170824:092743.005 sending configuration data to proxy "proc1" at "IP", datalen 113455
29900:20170824:092916.291 sending configuration data to proxy "proc2" at "IP", datalen 2698

過去のフォーラムを参考にプロキシのStartTrappers=5→10に変更もしてみました。

サーバからの動きとしては2台のプロキシに情報を求める

要求のあった情報を所持しているプロキシが情報を返す

情報を持っていないプロキシは応答しない為タイムアウトになる
という動きになるのでしょうか。

別件でzabbixサーバのweb画面で設定した2台のプロキシ内でホストが勝手に移動してしまうのですが
通信状態の良いほうに紐づくなどあるのでしょうか?

色々と質問申し訳ございません

ユーザー fripper の写真

ZabbixProxyを2台構成されている、とのことですが‥
ZabbixServer側では、各々、別Proxyとして登録されているのですよね?
 ・同名で2台のProxyは存在できないため

この場合、監視対象となる個々のホストは、各々、どちらか片側の
「Proxyの配下ホスト」として設定・登録することになるはずです
 ・監視対象ホストは、1台のProxy配下にしか設定できないため

★zabbixサーバのweb画面で設定した2台のプロキシ内でホストが勝手に移動してしまう‥
とのことですが、監視対象ホストに対して、ネットワークディスカバリ等で
自動登録するような設定がされていませんか?
Proxy1から「発見→自配下のホストとして登録」されたものと
Proxy2から「発見→自配下のホストとして登録」されたものが被ってしまい
上書きで更新された結果、経由Proxyが取っ替え引っ替えしているように見える‥とか?

また、Server・Proxyのホスト時刻は一致していますか?
Server側での設定投入・設定更新時刻よりも、Proxy側の時刻が進んでいたりすると
おかしな挙動となることがあります

Proxy2台を、フェイルセーフ用の冗長対策向けに考えて構築しておいて
どちらも同じProxy名として動作させ「どちらか経由で監視されてくれれば良い」
‥というのは、構成的に結構厄介な気がします

・エージェント側は「Server」に書かれたProxyからの問い合わせに応答する
 ・両方のProxyが元気なときは、2台のProxyから個別に監視データ取得の
  ポーリングされるので、エージェント側の負荷が倍増
 ・両方のProxyが元気なときは、2台のProxyから個別に監視結果データが
  Serverへ報告されるので、Server側でデータ行が2重保存され、DBサイズが肥大化
  時系列も前後してしまい、時系列に依存するようなトリガーの誤検知も発生し得る
・エージェント側は「ServerActive」に書かれたProxyへデータを預ければ、
 アクティブチェック系データは報告完了なので捨てる‥
 ・たまたま預けられた側のProxyがServerへ報告する前に落ちてしまえば
  その部分のデータは欠損

ユーザー siki の写真

>ZabbixProxyを2台構成されている、とのことですが‥
>ZabbixServer側では、各々、別Proxyとして登録されているのですよね?
> ・同名で2台のProxyは存在できないため
→別名で登録しています

プロキシ内でホストが勝手に移動してしまう‥
については自動登録されてるか確認してみます。
ディスカバリは無効にしたはずですが他に方法が無いか見てみます。
補足ですがテンプレートはTemplate OS Linuxを使用し
必要なアイテムとトリガー以外は無効にしています。

時刻は一致していたとしてやはりタイムアウトを
なくすことはむずかしいですよね。。。

構成についても見直しが必要みたいですね。。。
貴重なご意見ありがとうございました。

また何かあれば質問させていただきます。