housekeeper processの負荷削減につきまして

お世話になります。Ver6.2.6(AlamaLinux AWS EC2) を使用しております。

約8,000台の監視ホストに対し、約10,000アイテム(監視対象に紐付けしているテンプレートに
より1ホストあたりのアイテム数は変動、10,000はダッシュボードより確認した有効アイテムの
総数です)で稼働しております。
ヒストリ保存期間30d、トレンド365dです。双方削除処理有効、保存期間設定の上書きは行なっ
ておりません。
現在housekeeper processが添付の状態となっており、下記対応を行いましたが改善が図れず
におります。
・不要なアイテム、LLDの削除、無効化
・アイテムの監視感覚を広げる
・MaxHousekeeperDelet値の変更(5000→100000)
・start poller processes値の変更(5→30)
調査を行う中で、housekeeper processの平均値が80%以内であれば大きく気にする必要はない
とも確認いたしましたが、平均値80%も既に超えてきてしまっており、また100%の状態が長時
間になってきているのでなんとかしたいと思っております。
稚拙な説明で恐縮ではございますが、ご教示方何卒宜しくお願い申し上げます。

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー ridleyi の写真

手動削除はどうでしょうか(verは異なりますが下記参考)
https://tech-mmmm.blogspot.com/2021/09/zabbixhousekeeping.html

CPU負荷が上がっていなければ、放置しても問題無さそうな気もしますが・・・
(いつもTNKさんが返信しているから気軽に書き込んでも良いものか5分ほど悩むw)

ユーザー tam2 の写真

ridleyi様、ご教示と参考URLの方有難うございます。

>CPU負荷が上がっていなければ、放置しても問題無さそうな気もします
CPU負荷は問題はないと思っておりますので(現在の状態で使用率平均約8%)このまま様子
見にしたいと思います。

薄識のため自身で調査したことに自信が持てず回答が出せずにおります。
なので、スキルと経験をお持ちの方にこのようにご教示頂けることは本当に有り難いです!
また質問させて頂く機会があるかと思いますので、その節はどうぞ宜しくお願いいたします。

ユーザー TNK の写真

ridleyiさん
気軽に書き込んで頂いて問題ありません。

ユーザー TNK の写真

アイテムの削除や監視間隔の延長を行ったとしても、housekeeper
が削除しているのは過去のデータ(ヒストリであれば30日以上前と
か)ですので、監視設定を変更しても削除する件数が減るまでには
日数がかかります。削除する量はすぐには減りません。

ログにhousekeeperプロセスが毎回どのくらいのデータを削除して
いるかが出力されているので、MaxHousekeeperDeleteの値と比較し
てみてください。

あとは、データベースの処理性能にも依存するので、使用している
DBMSのチューニングの余地がないかも確認すると良いと思います。

ユーザー tam2 の写真

THK様、いつもとても詳細に、またスキルの低い当方にも優しい説明を有難うございます。

>housekeeperが削除しているのは過去のデータ(ヒストリであれば30日以上前
housekeeperの負荷が下がらない事に焦って、こちらのご説明の内容はすっかり抜けてお
りました。有難うございます!

>ログにhousekeeperプロセスが毎回どのくらいのデータを削除して
>いるかが出力されているので、MaxHousekeeperDeleteの値と比較
>DBMSのチューニングの余地
ご教示有難うございます。本日確認したいと思います。

この度も本当に有難うございました。今後とも何卒宜しくお願い申し上げます。