動作が重くなる事象の原因と対策につきまして

バージョン:4.0.35

データ取得ができない等Zabbixの動作が非常に重くなる事象が発生いたしました。
OS再起動により解消した後、調査したところ以下のような状況でした。

・CPUおよびメモリには異常はなく、終始使用率60%程度で安定していた
・ネットワークトラフィックにも高負荷は見当たらず
・事象の発生とほぼ一致するタイミングで、history housekeeper processおよびhistory syncer processが一気に100%近くにまで上昇していた
・事象発生の約1カ月前に12台ほど監視対象機器を追加していた(アイテム数にして2000件ほどの追加)

これらの状況から、データの取得数が大幅に増加したことでhistory housekeeper processおよびhistory syncer processによる負荷が増大し、
本事象に繋がったのではないかと考えております。

(1)上記の見解に相違ありませんでしょうか? 他に考えられる可能性などありましたらご教授いただけますと幸いです。
(2)監視対象機器やアイテム数の削減以外に本事象の再発防止となるような手段はございませんでしょうか?

以上です。
何卒お力添えいただけますと幸いに存じます。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー Sono un fan di Zabbix. の写真

「データ取得ができない等Zabbixの動作が非常に重くなる」ということであれば、
Zabbix内部プロセスの稼働状況やフロントエンドの「キュー」の状態を確認してみるのが良いと思います。
これらの値が高い場合は、Zabbixの設定ファイルから対象のプロセスの数を増やすと負荷が減ることが期待できます。
但し、増やし過ぎるとメモリ使用量が増えますので注意する必要はあります。