Proxmox VEが頻繁に落ちる
以前購入したRyzen 7 4700GEを搭載したThinkCentre M75q-2 Tinyの調子が悪い。
症状としては管理画面にはアクセスできず、モニタに映るコンソール画面からは何も操作できずフリーズ。
再起動するには電源を抜くしかなく、そのせいかログにも大した情報が残っていなかった。
数時間で落ちる時もあれば1時間かからずに落ちる時もあった。
全体的にCPU使用率はそんなに高くないし、IO Delayの値が急激に高くなったりNVMe SSDが熱くなっていることから熱が原因か、あるいはストレージの故障かと思って入れ替えを試すも効果なし。
ZFS関連も怪しいと思い sync=disabled や atime=off を試すも効果なし。
再インストールももちろん効果なし。
RyzenとLinuxの相性が悪いという話やC Stateが悪さをするという記事を見かけ、UEFIからC State Supportを無効化したり、ZenStates-Linuxを動かしてみたりするも効果なし。
解決:UEFIからCPB Modeを無効化する
UEFI (BIOS) に入り、AdvancedからCPU Setupを開き、CPB ModeをDisableにすることで解決。
CPB ModeとはRyzenに搭載されている自動オーバークロック関連機能のうちの1つで、Core Performance Boostというのが正式名称。
これ以外にPrecision Boost Overdriveというものもあるので、もし動作が不安定なRyzen機があるならそちらも無効化することで解決するかもしれない。しないかもしれない。
参考
RyzenでProxmoxVEを組むとフリーズする件 - Qiita
はじめにProxmoxVEでサーバーを構築したのだが定期的にダウンしていた。原因が分かったため記事にする。追記(Proxmox7以降の話)pythonコマンドが無くなり、python3となりま…
Ubuntu x Ryzen 7環境での「BUG: soft lockup - CPU#NN stuck」を解消したい
M75q 2台目 自宅デスクトップPCをLenovoの小型PC「ThinkCentre M75q Tiny Gen2」へ入れ替えました。購入物は次の通りで、プレインストールのWindowsは使わずにUbuntuをインストールしています。
AMDとLinuxの相性が悪い問題 – ぐれメモ
GitHub - r4m0n/ZenStates-Linux: Dynamically edit AMD Ryzen processor P-States
Dynamically edit AMD Ryzen processor P-States. Contribute to r4m0n/ZenStates-Linux development by creating an account on...
コメント