分散監視にて、子ノードのイベントが親ノードに反映されないのですが
いつも大変お世話になっております。
分散監視にて、子ノードのイベントが親ノードに反映されないのですが、何が原因でしょうか?親、子ノード共に、zabbix 1.8.9 です。
web画面からの確認では、イベントのみ失敗している様で、監視設定、最新データ(ヒストリ)は反映しています。
Zabbixのログを確認したところ、
子ノード側にはエラーらしきメッセージ(NOT OK)が出力されております。Zabbixのログを添付致します。
<Zabbixのログ>
(子ノードのNodeID:103、親ノードのNodeID:999)
・子ノード上のログファイル(zabbix_server.log)
--- はじめ ---
1447:20120105:045116.648 NODE 103: Sending history_sync of node 103 to node 999 datalen 361
1447:20120105:045116.678 NODE 103: Sending history_uint_sync of node 103 to node 999 datalen 95
1447:20120105:045116.736 NODE 103: Sending events of node 103 to node 999 datalen 33022
1447:20120105:045116.752 NOT OK
1447:20120105:045126.808 NODE 103: Sending history_sync of node 103 to node 999 datalen 425
1447:20120105:045126.846 NODE 103: Sending history_uint_sync of node 103 to node 999 datalen 261
1447:20120105:045126.908 NODE 103: Sending events of node 103 to node 999 datalen 33022
1447:20120105:045126.927 NOT OK
1447:20120105:045137.080 NODE 103: Sending history_sync of node 103 to node 999 datalen 362
1447:20120105:045137.119 NODE 103: Sending history_uint_sync of node 103 to node 999 datalen 194
1447:20120105:045137.694 NODE 103: Sending events of node 103 to node 999 datalen 33022
1447:20120105:045137.807 NOT OK
--- 終わり ---
・親ノード上のログファイル(zabbix_server.log)
--- はじめ ---
1156:20120105:045116.732 NODE 999: Received history from node 103 for node 103 datalen 361
1155:20120105:045116.762 NODE 999: Received history_uint from node 103 for node 103 datalen 95
1158:20120105:045116.826 NODE 999: Received events from node 103 for node 103 datalen 33022
1155:20120105:045126.892 NODE 999: Received history from node 103 for node 103 datalen 425
1158:20120105:045126.930 NODE 999: Received history_uint from node 103 for node 103 datalen 261
1157:20120105:045127.001 NODE 999: Received events from node 103 for node 103 datalen 33022
1162:20120105:045137.165 NODE 999: Received history from node 103 for node 103 datalen 362
1162:20120105:045137.621 NODE 999: Received history_uint from node 103 for node 103 datalen 194
1162:20120105:045137.881 NODE 999: Received events from node 103 for node 103 datalen 33022
--- 終わり ---
子ノード側では、
「Sending events of node 103 to node 999 datalen 33022」と送信している様ですが、その直後に「NOT OK」メッセージを出力しております。
御忙しいところ、恐れ入りましが、問題解決・調査方法等、ご教授頂けないでしょうか?
よろしくお願い致します。
TNK - 投稿数: 4671
以下のURLにある現象に似ているように見受けられます。
http://www.zabbix.com/forum/showthread.php?t=24433
もしかしたら、以下のURLにある
2. Resend configuration from one child node to MASTER
の手順で回復できるかもしれません。
http://www.zabbix.com/wiki/doc/troubleshooting/index
内容をご確認下さい。
nayami - 投稿数: 41
いつも大変お世話になっております。
ご提示頂いたURL情報を基に、以下作業を実施致しましたが、
問題解決しませんでした。
1.マスターnodeを停止。
2.各子node上で、以下のSQLを実施。
?delete from node_cksum;
?delete from node_configlog;
※ただし、?のnode_configlogが存在しなかった為、
実施には?のSQL文のみ実施。
3.マスターnodeを開始。
マスターnode上もで、試しに、
「delete from node_cksum;」を実施しましたが、
問題解決しませんでした。
なにか、手順等に誤りがあったのでしょうか?
お手数ですが、ご指摘・ご支援のほど、よろしくお願い致します。
nayami - 投稿数: 41
いつも大変お世話になっております。
ご提示頂いた内容で、無事に回復致しました。
今回実施した作業としては、
親ノードのzabbixサーバのみハードウェアスペックを上げ、
ご提示頂いた対応を再度実施し、無事に回復致しました。
御忙しいところ、ご協力・ご支援頂きまして、有難う御座いました。