Ryzen被發現在Linux編譯會出現 segfault - 3C

Table of Contents

先說一下我的狀況,我是buildroot隨機會出錯,
但是完全沒有改任何設定繼續編譯卻可以編譯成功。
總之就是大量平行編譯會隨機出錯...

使用 https://github.com/suaefar/ryzen-test/blob/master/kill-ryzen.sh
測試(No Ramdisk),果然會出現這樣的錯誤(segmentation fault):
[KERN] Dec 21 22:19:39 Ryzen kernel: bash[7678]: segfault at 45 ip
0000000000701d40 sp 00007ffdcdb4c4e8 error 6

主機板也是Asus b350 plus, BIOS: 3401, 1700 / Ram: 16G DDR4
OS則是Linux Mint 18.2

嘗試過換kenerl版本(4.9-4.11),加過cpu電壓,關掉C-state,BIOS全預設
都一樣會出現上面的錯誤。雖然關掉SMT之後就正常,可是我總不能一直關著SMT阿QQ

後來先嘗試在linux裡關掉ASLR (Address space layout randomization)
echo 0 | sudo tee /proc/sys/kernel/randomize_va_space
好像也沒什麼用...

本來已經打算要RMA了,剛好看到板友RMA回來的步進一樣還是B1,
也有提到RCU設定(CONFIG_RCU_NOCB_CPU),就再嘗試看看重新編譯kernel(4.13.16)
主要就是 make menuconfig 裡面
-> General setup
-> RCU subsystem
這一項要打開,然後在grub cmdline裡面加入 rcu_nocbs=0-15
(因為我是8核1700,如果是6核心就是0-11 依此類推...)
看起來像是這樣:
GRUB_CMDLINE_LINUX_DEFAULT="rcu_nocbs=0-15"

再跑一次kill-ryzen.sh測試:
https://gist.github.com/anonymous/216826c5141f99a8307ec0d1da76cea6
就沒問題了。

總結:
BIOS: 3041
關掉C-State, ASLR
開啟RCU


希望跟我有一樣問題的人也可以不用RMA順利解決。

--

All Comments

Brianna avatarBrianna2017-12-29
1700用戶推,但不懂@a@
Olga avatarOlga2018-01-01
辛苦了
Regina avatarRegina2018-01-02
CPU-Z那個是誤判吧?連1950X都寫B1看那個不準
Mary avatarMary2018-01-04
以下開放UAC轟炸
Oliver avatarOliver2018-01-05
U:工作用的機器就是要穩
Selena avatarSelena2018-01-09
這不是工作用的機器,只是下班後的興趣...
Edith avatarEdith2018-01-11
我示範:電蝦黑暗的一天
Lydia avatarLydia2018-01-11
UAC INBOUND
Mason avatarMason2018-01-14
我intel工作機也會啊 反正rebuild會好
Rae avatarRae2018-01-16
可是我覺得不能忍QQ
Gilbert avatarGilbert2018-01-18
Aaliyah avatarAaliyah2018-01-21
Linda avatarLinda2018-01-26
Intel的U根本不需要開開關關一堆功能就能穩定使用
不像某A倉促上市還要全民debug 單核效能還追不上I
更別提軟體支援性大多都是以Intel為中心做優化
Kristin avatarKristin2018-01-28
對企業來說買來就能穩定使用才是一切 因為time is m
oney
Caroline avatarCaroline2018-01-28
對啊 每個人都是企業 時間都是金錢
Valerie avatarValerie2018-01-29
推個
Suhail Hany avatarSuhail Hany2018-01-30
AMD不是說ryzen有遇到啥編譯bug 就可申請RMA嗎?
RMA回來會換給你B2步進的
Cara avatarCara2018-02-02
我記得RMA也是會叫你先確認上面這些步驟
Edward Lewis avatarEdward Lewis2018-02-03
我是因為能不拆就不拆太懶惰了
Dora avatarDora2018-02-06
buildroot隨機出錯很崩潰…放著去做別的事時間差不
多了回來看結果發現出問題XD
William avatarWilliam2018-02-10
最近怎沒看到V寶了
Belly avatarBelly2018-02-13
說Intel的U不需要關的 大概是沒用過Linux拔
Lily avatarLily2018-02-16
他應該是在反串吧XD
Megan avatarMegan2018-02-20
之前用過i7 embedded也是一堆毛