ホーム » 「apcupsd」タグがついた投稿
タグアーカイブ: apcupsd
UPS交換(Linux 7.0による警告対策)
UPSが大量の警告
Ubuntu 26.04 の導入により Linux の Kernel も linux-image-7.0.0-14-generic になったが、移行後の Load Average が高い。
原因を調べると(後述)、apcupsd で kernel が以下の警告を毎秒くらいの頻度で出ている。APC ES 750 を使っているけど、4byte の返答があるはずなのに2byteしか返ってこないという内容らしい。このため、syslog のファイル出力でシステム負荷が 0.4 ほどに上がっている。
4月 24 23:05:29 ... kernel: hid-generic ... :Event data for report 22 was too short (4 vs 2)
以前の Kernel なら、同様のエラーはでていたのかもしれないが、syslog に警告を記録していなかったから、問題にはならなかった。Kernel が 7.0 になり、この辺の対応がきちんとするようになったのが原因のようだ。

しかたがないので、syslog でこのメッセージを記録しないように設定したけど、それでも 負荷が 0.2 ほどになる。
以前の Kernel なら、0.1 程度だったので、 なんとなくヤな感じ。
負荷の原因の見つけ方
今回、UPS の原因を見つけるにあたり、Gemini を活用しまくり。top の出力を Gemini にかけて、pidstat, vmstat などの結果を確認して…の繰り返し。
$ top
$ htop # あまり重い処理がみつからない
$ sudo pidstat 2 5 # 2秒おきの集計を5回表示
$ sudo vmstat 1 5 # 負荷の原因が、計算かディスク待ちか
$ sudo iotop -o # どのプロセスが入出力しているか
# ここで、systemd-jounald が原因というのが判明
$ sudo journalctl -f # Syslog を確認
# ここで、UPS のログが見つかる
UPSのエラー対策
UPS のエラー警告だけど、UPS の状況を確認すると、apcaccess コマンドの結果が、「ONLINE:つながってるけど NOBATT:バッテリーがつながっていない」との出力がでている。充電電圧も出力されていてバッテリーは動いているはずなのに…。Gemini に聞いても「UPS のよくある故障だし、Syslog を無視するようにして問題なく、他の機能が正しく動いているなら無視していい」とのアドバイス。
$ apcaccess : STARTTIME: 2026-04-24 17:54:04 +0900 MODEL : APC ES 750G STATUS : ONLINE NOBATT
Syslog をフィルタリングしてディスクI/Oが改善しているとはいえ、以前より負荷が高い状態は気持ち悪いので、USPを交換した際の予備(バッテリー交換済み APC ES 550)があったので、元に戻した。
交換したら、UPS の警告は出なくなり、Syslog フィルタリング処理も不要になって、負荷も 0.1 程度に落ち着いたので、これで良し!!

ブレーカー落ちた
洗濯機の乾燥機能が動かなくなり、修理に来てもらって無事動いたのはいいけど、夜にブレーカーが落ちた。
自宅サーバへの被害も考え、UPS電源の電圧を APCUPSD でモニタリングしていて、電源電圧が下がると、google-home で警告メッセージが流れるようにしてあるんだが、動作せずに落ちてる。nagios4 の LOG をみると、電圧低下は検出しているけど、通知が発動していない。なんでやねん。
(2023-12-03追記)
別のタイミングでは、警告メッセージの読み上げは動いていた。夜間はスピーカ音量を落としているので、気づきにくい音になってたけど。
UPSがself-testでブザーとまらず
3年物のAPCのUPS APC ES 550(BE550G-JP)が、朝の5:00にブザーが鳴って止まらず。
電圧異常かと思って、電源ボタンを押したら停止。でも、サーバはシャットダウン操作してないで落ちてる。
LOGを確認すると、apcupsd の self-test 機能が動いて、バッテリーの交換時期なので、ブザーを鳴らしたみたい。マニュアルを見ると「停止条件は『電源オフ』」実は、ひと月前にも同じようにブザーが鳴って、今回は2回目。self-test の期間は、2週間に設定されているみたいなので、このままだと、また叩き起こされそう。
電源異常じゃないのならバッテリー交換とも思うけど調べると交換バッテリー7000円。前のUPSは、保持時間が多少落ちようとも無視して本来2~3年の寿命の物を5年以上使ってた。今回も劣化を無視してもう少し使いたい。
apctestでbattery dateを修正
UPS監視ソフトの apcupsd の付属ソフトに、apctest でセルフテストを直にさせようと思ったけど、上手く動かない。でも、battery の日付を書き換えるコマンドがある。寿命をだますということで、試しにバッテリー交換してないけど日付を書き換えてみた。これで、だませるかな。
(2020/12/28:追記) バッテリーが消耗していれば、battery-date を修正しても、朝の4:45に再びブザーが鳴り響き、効果なかった。(T_T;
ついでに、夜中にバッテリー警告で起こされるのもつらいので、警告音を DISABLE にできるみたい。munin で、バッテリー状況は観察してるし、自宅サーバだし「落ちてもたかがしれている状態」なので、問題ないだろう。とはいいながら、エラーが改めてでなくなるのを確認するまでは、ENABLE にしておくか。
$ sudo systemctl stop apcupsd.service $ sudo apctest (略) Please select the function you want to perform. 1) Test kill UPS power 2) Perform self-test 3) Read last self-test result 4) View/Change battery date : Select function number: 4 Current battery date: 09/12/2016 Enter new battery date (MM/DD/YYYY), blank to quit: 09/12/2020 : 6) View/Change alarm behavior : Select function number: 6 Current alarm setting: DISABLED Press... E to Enable alarms D to Disable alarms Q to Quit with no changes Your choice: Select function: q
apcupsd.conf の修正
(2020/12/28) 何らかの selft-test と思って、バッテリー日付の修正を試したが効果が無いので、改めて、正統な selft-test 機能を止める方法。
(( /etc/apcupsd/apcupsd.conf )) # Self test interval in hours 336=2 weeks, 168=1 week, ON=at power on # SELFTEST 336 168 ON OFF (default = 336) SELFTEST OFF



