StatusをMonitoredにするとZabbix Serverプロセスが強制終了します

いつもフォーラムを拝見しております、takhidemoと申します。
 先日1.8.2へ乗り換えたのですが、HostsのStatusをNot monitoredからMonitoredに変えるとserverプロセスが強制終了してしまいます。(Not monitoredのままであれば終了しません)
ログで確認したところ、DB Cache部分に問題があるようなのでZabbix_server.confのDBキャッシュ関連の数値を変えてみたのですが改善しませんでした。恐れ入りますが他に何か確認事項があれば御教授頂けませんでしょうか。

OS:Solaris 10 10/08 s10s_u6wos_07b SPARC
Memory:1GB
zabbix-1.8.2
apache 2.2.11
mysql 5.0.67
php-5.2.10

ログレベル4
2145:20100614:222652.210 Syncing ...
2145:20100614:222652.210 In DCsync_configuration()
2145:20100614:222652.211 In DCsync_hosts()
2145:20100614:222652.211 Query [txnlev:0] [select hostid,proxy_hostid,host,useip,ip,dns,port,status,useipmi,ipmi_ip,ipmi_port,ipmi_authtype,ipmi_privileg
e,ipmi_username,ipmi_password,maintenance_status,maintenance_type,maintenance_from,errors_from,available,disable_until,snmp_errors_from,snmp_available,snmp
_disable_until,ipmi_errors_from,ipmi_available,ipmi_disable_until from hosts where status in (0) and hostid between 000000000000000 and 099999999999999 ord
er by hostid]
2144:20100614:222652.219 One child process died (PID:2145). Exiting ...
2144:20100614:222654.230 Connect to the database
2144:20100614:222654.233 Query [txnlev:0] [SET NAMES utf8]
2144:20100614:222654.233 Query [txnlev:0] [SET CHARACTER SET utf8]
2144:20100614:222654.234 In free_database_cache()
2144:20100614:222654.234 In DCsync_all()
2144:20100614:222654.235 In DCsync_history(history_first:0 history_num:0)
2144:20100614:222654.235 Syncing history data...
2144:20100614:222654.235 In DCsync_trends() trends_num:0
2144:20100614:222654.235 Syncing trends data...
2144:20100614:222654.236 Syncing trends data...done.
2144:20100614:222654.236 End of DCsync_trends()
2144:20100614:222654.236 End of DCsync_all()
2144:20100614:222654.236 End of free_database_cache()
2144:20100614:222654.237 In free_configuration_cache()
2144:20100614:222654.237 End of free_configuration_cache()
2144:20100614:222654.238 Zabbix Server stopped. Zabbix 1.8.2 (revision 11211).
ログレベル3
2255:20100614:224501.971 Starting Zabbix Server. Zabbix 1.8.2 (revision 11211). 2255:20100614:224501.973 **** Enabled features ****
2255:20100614:224501.973 SNMP monitoring: YES
2255:20100614:224501.973 IPMI monitoring: NO
2255:20100614:224501.973 WEB monitoring: YES
2255:20100614:224501.973 Jabber notifications: NO
2255:20100614:224501.974 ODBC: NO
2255:20100614:224501.974 SSH2 support: NO
2255:20100614:224501.974 IPv6 support: NO
2255:20100614:224501.974 **************************
2256:20100614:224502.014 server #1 started [DB Cache]
2257:20100614:224502.203 server #2 started [Poller. SNMP:YES]
2258:20100614:224502.494 server #3 started [Poller. SNMP:YES]
2259:20100614:224502.751 server #4 started [Poller. SNMP:YES]
2260:20100614:224502.813 server #5 started [Poller. SNMP:YES]
2261:20100614:224502.907 server #6 started [Poller. SNMP:YES]
2262:20100614:224502.915 server #7 started [Trapper]
2263:20100614:224502.926 server #8 started [Trapper]
2264:20100614:224502.937 server #9 started [Trapper]
2265:20100614:224502.948 server #10 started [Trapper]
2266:20100614:224502.958 server #11 started [Trapper]
2267:20100614:224502.969 server #12 started [ICMP pinger]
2268:20100614:224502.983 server #13 started [Alerter]
2269:20100614:224502.998 server #14 started [Housekeeper]
2269:20100614:224503.000 Executing housekeeper
2270:20100614:224503.402 server #15 started [Timer]
2272:20100614:224503.752 server #17 started [HTTP Poller]
2271:20100614:224503.989 server #16 started [Poller for unreachable hosts. SNMP:YES]
2274:20100614:224504.412 server #19 started [DB Syncer]
2273:20100614:224504.546 server #18 started [Discoverer. SNMP:YES]
2275:20100614:224504.557 server #20 started [Escalator]
2255:20100614:224504.700 server #0 started [Watchdog]
2269:20100614:224524.993 Deleted 0 records from history and trends
2255:20100614:230502.268 One child process died (PID:2256). Exiting ...
2255:20100614:230504.273 Syncing history data...
2255:20100614:230504.274 Syncing trends data...
2255:20100614:230504.274 Syncing trends data...done.
2255:20100614:230504.275 Zabbix Server stopped. Zabbix 1.8.2 (revision 11211).

コメント表示オプション

お好みのコメント表示方法を選び「設定の保存」をクリックすると変更が反映されます。
ユーザー KAZ の写真

takhidemoさん

DB Cacheは終了シーケンスで実行されるもので、それ自体は問題ないと思います。問題はそれ以前に起きている「One child process died (PID:????). Exiting ...」でこれが発生した為に終了シーケンスに流れていると思われます。

↓この部分ですね。
<code>
ログレベル4
2145:20100614:222652.210 Syncing ...
2145:20100614:222652.210 In DCsync_configuration()
2145:20100614:222652.211 In DCsync_hosts()
2145:20100614:222652.211 Query [txnlev:0] [select hostid,proxy_hostid,host,useip,ip,dns,port,status,useipmi,ipmi_ip,ipmi_port,ipmi_authtype,ipmi_privileg
e,ipmi_username,ipmi_password,maintenance_status,maintenance_type,maintenance_from,errors_from,available,disable_until,snmp_errors_from,snmp_available,snmp
_disable_until,ipmi_errors_from,ipmi_available,ipmi_disable_until from hosts where status in (0) and hostid between 000000000000000 and 099999999999999 ord
er by hostid]
2144:20100614:222652.219 One child process died (PID:2145). Exiting ...
</code>
なので、同期処理に問題がある様に思われます。

DCsync_hosts関数のなかでSQL発効後エラーになっているようなのでソースを読んでみます。

ユーザー KAZ の写真

takhidemoさん

※※ 2010-06-15 09:05 訂正

[d]今気付きましたが、ログレベル3と4でエラーの出ているところが違います。別原因の様な…A(^^;
ログレベル4は同期中にプロセスが死にますが、ログレベル3はハウスキーピング(ヒストリとトレンドのデータを消す)で死んでいるように見えます…[/d]
[color=FF0000]ログレベル4何らかのプロセスが同期処理中にダウンしていますが、ログレベル3はDB Cache処理がプロセスダウンしています。[/color]

[d]どちらも、ヒストリとトレンドのデータに関係しているところが共通しています…[/d]

レベル4のログを起動したところから見せて頂けるか、メールで送って頂けると助かるのですが…A(^^;
※:落ちたプロセスがなにか知りたいです。それもDB Cacheプロセスなのでしょうか?

ユーザー KAZ の写真

takhidemoさん

本家(Zabbix SIA)でバグ報告が上がっていました。
[url=https://support.zabbix.com/browse/ZBX-2153]zabbix_server die after start <defunct> SIGBUS[/url]

英語が苦手なのであっているか不安ですが、Solarisで発生する問題のようです。
※:1.8.3で対処されるようです。

本家には報告者が修正方法を投稿されているので、その通りにソースを修正して(パッチを実行して)再度実行ファイルを作り直して頂ければ対処できると思います。

ユーザー takhidemo の写真

KAZ様

takhidemoと申します、大変貴重な情報ありがとうございます。
公式でも認識している問題と言う事で安心致しました。
今後は本家のバグ報告にも目を通すように致します。
御教示本当にありがとうございました。