Ryzen被發現在Linux編譯會出現 segfault - 3C

Madame avatar
By Madame
at 2017-12-25T20:55

Table of Contents

先說一下我的狀況,我是buildroot隨機會出錯,
但是完全沒有改任何設定繼續編譯卻可以編譯成功。
總之就是大量平行編譯會隨機出錯...

使用 https://github.com/suaefar/ryzen-test/blob/master/kill-ryzen.sh
測試(No Ramdisk),果然會出現這樣的錯誤(segmentation fault):
[KERN] Dec 21 22:19:39 Ryzen kernel: bash[7678]: segfault at 45 ip
0000000000701d40 sp 00007ffdcdb4c4e8 error 6

主機板也是Asus b350 plus, BIOS: 3401, 1700 / Ram: 16G DDR4
OS則是Linux Mint 18.2

嘗試過換kenerl版本(4.9-4.11),加過cpu電壓,關掉C-state,BIOS全預設
都一樣會出現上面的錯誤。雖然關掉SMT之後就正常,可是我總不能一直關著SMT阿QQ

後來先嘗試在linux裡關掉ASLR (Address space layout randomization)
echo 0 | sudo tee /proc/sys/kernel/randomize_va_space
好像也沒什麼用...

本來已經打算要RMA了,剛好看到板友RMA回來的步進一樣還是B1,
也有提到RCU設定(CONFIG_RCU_NOCB_CPU),就再嘗試看看重新編譯kernel(4.13.16)
主要就是 make menuconfig 裡面
-> General setup
-> RCU subsystem
這一項要打開,然後在grub cmdline裡面加入 rcu_nocbs=0-15
(因為我是8核1700,如果是6核心就是0-11 依此類推...)
看起來像是這樣:
GRUB_CMDLINE_LINUX_DEFAULT="rcu_nocbs=0-15"

再跑一次kill-ryzen.sh測試:
https://gist.github.com/anonymous/216826c5141f99a8307ec0d1da76cea6
就沒問題了。

總結:
BIOS: 3041
關掉C-State, ASLR
開啟RCU


希望跟我有一樣問題的人也可以不用RMA順利解決。

--
Tags: 3C

All Comments

Brianna avatar
By Brianna
at 2017-12-29T20:18
1700用戶推,但不懂@a@
Olga avatar
By Olga
at 2018-01-01T17:11
辛苦了
Regina avatar
By Regina
at 2018-01-02T03:12
CPU-Z那個是誤判吧?連1950X都寫B1看那個不準
Mary avatar
By Mary
at 2018-01-04T16:22
以下開放UAC轟炸
Oliver avatar
By Oliver
at 2018-01-05T16:54
U:工作用的機器就是要穩
Selena avatar
By Selena
at 2018-01-09T10:17
這不是工作用的機器,只是下班後的興趣...
Edith avatar
By Edith
at 2018-01-11T03:04
我示範:電蝦黑暗的一天
Lydia avatar
By Lydia
at 2018-01-11T07:03
UAC INBOUND
Mason avatar
By Mason
at 2018-01-14T14:11
我intel工作機也會啊 反正rebuild會好
Rae avatar
By Rae
at 2018-01-16T10:48
可是我覺得不能忍QQ
Gilbert avatar
By Gilbert
at 2018-01-18T22:34
Aaliyah avatar
By Aaliyah
at 2018-01-21T21:29
Linda avatar
By Linda
at 2018-01-26T11:35
Intel的U根本不需要開開關關一堆功能就能穩定使用
不像某A倉促上市還要全民debug 單核效能還追不上I
更別提軟體支援性大多都是以Intel為中心做優化
Kristin avatar
By Kristin
at 2018-01-28T17:04
對企業來說買來就能穩定使用才是一切 因為time is m
oney
Caroline avatar
By Caroline
at 2018-01-28T20:37
對啊 每個人都是企業 時間都是金錢
Valerie avatar
By Valerie
at 2018-01-29T17:44
推個
Suhail Hany avatar
By Suhail Hany
at 2018-01-30T23:33
AMD不是說ryzen有遇到啥編譯bug 就可申請RMA嗎?
RMA回來會換給你B2步進的
Cara avatar
By Cara
at 2018-02-02T03:32
我記得RMA也是會叫你先確認上面這些步驟
Edward Lewis avatar
By Edward Lewis
at 2018-02-03T23:17
我是因為能不拆就不拆太懶惰了
Dora avatar
By Dora
at 2018-02-06T14:24
buildroot隨機出錯很崩潰…放著去做別的事時間差不
多了回來看結果發現出問題XD
William avatar
By William
at 2018-02-10T19:37
最近怎沒看到V寶了
Belly avatar
By Belly
at 2018-02-13T00:29
說Intel的U不需要關的 大概是沒用過Linux拔
Lily avatar
By Lily
at 2018-02-16T00:41
他應該是在反串吧XD
Megan avatar
By Megan
at 2018-02-20T05:00
之前用過i7 embedded也是一堆毛

家用機處理

Todd Johnson avatar
By Todd Johnson
at 2017-12-25T20:36
大家安安 小弟有個問題想請教各位 家裡目前有台電腦 無法開機 也沒確認是什麼問題 因為小弟在台北工作偶爾才回家 想說整理一下那台電腦回家也能用 因為之前我老媽是直接買順發裝好的機子 大概已經四五年有了 之前我有問朋友如果平常看看YouTube 然後看網頁、打lol不頓不求全效 這樣大概多少 ...

20k文書影音機

Steve avatar
By Steve
at 2017-12-25T20:13
已買/未買/已付訂金(元):未買 預算/用途:文書、影音、上網 CPU (中央處理器):AMD R5 1600 MB (主機板):華擎 AB350M PRO4 RAM (記憶體):金士頓 DDR4 8G 2133 VGA (顯示卡):MSI RX560 AERO 4G HDD (硬碟):美 ...

1050ti真的那麼不堪的話 那應該要賣多少

Agatha avatar
By Agatha
at 2017-12-25T18:34
常常看到有單裡面有這等級的卡時候 下面留言 一定是再三勸阻說用1050或加錢買1060 3g就好 就是打死都不碰1050ti 1050ti被詬病的原因 主要是價格 那價格大約要多少 才會比較多人 接受呢 以全新的來看 - ...

電腦椅 2K內有推薦的嗎?

Wallis avatar
By Wallis
at 2017-12-25T18:23
我知道可能會有人說2K以內隨便買,可是最近已經坐壞一張了 (雖然這張不是我選的)https://i.imgur.com/WAKDCJd.jpg 預算實在不夠,不是我捨不得花是真的沒有錢,加不了直上不了 希望: 可以坐1年(上面那個才3~4個月就...) 有椅背可以靠(現在這個腰很不適) 屁股坐的地 ...

更換主機板腳位店家

Robert avatar
By Robert
at 2017-12-25T17:53
手邊有塊板子腳針有歪幾根導致記憶體某槽讀不到 手工修正後能正常讀取,雖然以記憶體預設頻率能正常開機使用 但只要記憶體超頻,原本有問題那槽有插記憶體就會無法開機 交叉測試推測歪掉的腳針扳正還是多少影響超頻到穩定性 查了一下由於這板子台灣沒有賣,所以皇家維修政策寫著不給收850更換腳位 (之前有送過公司 ...