警告!不要再用Raid 5了! - 儲存設備
By Ula
at 2014-12-26T05:28
at 2014-12-26T05:28
Table of Contents
一、前言
我不是什麼危言聳聽,也不是什麼RAID排斥,也不是我爆了RAID5的悲憤警世文
完完全全只是數學問題。
有心有空看數學流程的,請繼續看下去。沒空的也請相信我。
不管你用的是主機板的RAID、還是用NAS的、抑或是高階陣列卡,
是Software-based RAID、Hardware-based RAID、抑或是Driver-based,
只要你用的是消費級的硬碟,且容量上TB等級,
不要再用RAID 5了
不要再用RAID 5了
不要再用RAID 5了
現在還再用RAID5的請趕快升級成RAID6。
就算你有10顆Hot Spare也一樣。
因為
當你遇到問題時
你完全成功重建的機率
比你想像中的
低
接下來開始解釋為什麼,會有硬碟規格和數學,
有心有空看數學流程的,請繼續看下去。沒空或看到數學就頭痛的,
也請聽進我一席話。
二、URE
硬碟有個參數,叫 uncorrectable read error,
更詳細一點的說叫 Non-recoverable read errors per bits read
簡稱ure,其中文為每位元讀取發生無法復原的讀取錯誤
一般消費級硬碟(包括消費級NAS碟),這個參數官方通常是給
1/10E14
(讀做10分之1的14次方,或10的負14次方,或零點零零零零零零零零零零零零零一)
是個看起來很小的值。
什麼意思呢?
平均每讀取100,000,000,000,000位元,就會讀到1位元壞掉、且無法修復的資料。
或是
平均每讀取12.5TB,就會讀到1位元壞掉、且無法修復的資料。
挖靠!這樣看起來更小了。
這個數值大家就先記在心裡。
企業級的硬碟,ure通常是1/10E15甚至1/10E16。
三、RAID 5
再來提提RAID 5。
RAID 5是啥,我就不細說了,不知道的你也不應該組RAID 5...
RAID 5成員其中之一離線後,狀態會變為降級(degraded),
此時,若有備援、或是手動換一顆加入,則會進入重建狀態(rebuild),
重建時,會讀取所有資料,算出離線成員的資料,並寫入備援碟。
所有資料 = RAID 5可用容量,若你拿2TBx3組,就是4TB。
重建是否成功、能否保全資料,就看能否正確的讀取所有資料了。
PS. 一般RAID與檔案系統無關,控制器不會知道你的硬碟哪裡有、放了多少資料。
所以,重建時是對整組RAID、所有磁區去做。
例外是一些軟體層的RAID,本身即是檔案系統、或位於檔案系統之下,
在檔案系統的層級加入RAID概念,是可能只針對有資料的部分做重建的。
如ZFS、ReFS。
四、完美重建成功機率
接下來,就是高中數學了,
我們有
單次事件發生機率 ure
事件次數 = 可用容量
那,我們就能算多次事件下,發生(或不發生)的機率了:
完全不發生ure(不出錯)的機率(完全成功重建)
= (1 - 單次機率) ^ (次數)
= (1 - ure) ^ (容量)
帶入
ure = 1/10E14
可用容量 = 4TB(32x10E12位元)
完全不發生ure的重建機率 = (1-1/10E14)^(32x10E12)
喔數字都好大,怎麼算? 你可以用高級計算機、Excel或是取Log搭配一般計算機。
反正我直接告訴你答案:
使用消費級硬碟組成4TB可用容量的RAID 5,一個位元都不壞的成功重建機率 =
72.6%
順便再多給幾個資料點
4TB = 72.6%
6TB = 61.9%
8TB = 52.8%
我不知道你對這個機率是否滿意。
我個人是很不滿意啦。
若考慮容錯的真義,4TB的狀況對我來說尚可接受。
但在現在單顆4TB性價比如此高,誰會組個4TB的RAID5阿!
當然你可以用企業級、URE較低的硬碟,那是可以把機率提升到90%以上。
但也沒十分高,下面會附上表格。
五、發生read error時
重要:read error和上述的URE不盡相同,但這邊提一下讓大家參考
發生Read error時,根據硬碟與陣列控制卡的行為與設定,會有幾種狀況,
實際的情況比較複雜,我簡單列幾個出來:
1. 硬碟根本沒發現read error!但是讀出來的資料是錯的。
結果:你的資料壞了1bit(通常不止),而且不會主動發現!
嚴重性:看你的資料價值。
2. 硬碟發現Read error,可能是Checksum failed,並開始硬碟內的ERC。
2.a. 修復成功,嚴格說來這樣就不算URE。
2.b. 花過多時間修復,被RAID踢掉。
結果:這顆就離線了,如果你正在重建,恭喜你!RAID Failed!
如果你的RAID無法手動調整RAID組態...那狀況是有點嚴重。
2.c. 因TLER設定而及時放棄修復:
結果:RAID控制器收到錯誤訊息並記錄;
如果有容錯,則會嘗試用其他顆硬碟資料,重建這個位元。
如果容錯失效(如RAID5重建中),則會通常控制器跳過這個位元。
六、RAID 5 完美重建機率
容量
URE 4TB 6TB 8TB 10TB 12TB 14TB 16TB
1E-14 72.63% 61.90% 52.76% 44.96% 38.32% 32.66% 27.83%
1E-15 96.85% 95.32% 93.81% 92.32% 90.85% 89.41% 87.99%
1E-16 99.65% 99.47% 99.29% 99.12% 98.94% 98.76% 98.59%
七、後記
這篇的原稿我是在2013/1/16完成的,
當時我用的是消費級2TBx8,猶豫要上RAID 5還是RAID 6,
於是就查規格、動手算,果斷RAID 6。
有空再分享RAID 6的計算部分。
現在呢?
那些2TB都賣光了XD
今天,因為單身的聖誕節很無聊,
把兩年前的文章整理出來,當作給大家遲來的聖誕禮物吧。
--
我不是什麼危言聳聽,也不是什麼RAID排斥,也不是我爆了RAID5的悲憤警世文
完完全全只是數學問題。
有心有空看數學流程的,請繼續看下去。沒空的也請相信我。
不管你用的是主機板的RAID、還是用NAS的、抑或是高階陣列卡,
是Software-based RAID、Hardware-based RAID、抑或是Driver-based,
只要你用的是消費級的硬碟,且容量上TB等級,
不要再用RAID 5了
不要再用RAID 5了
不要再用RAID 5了
現在還再用RAID5的請趕快升級成RAID6。
就算你有10顆Hot Spare也一樣。
因為
當你遇到問題時
你完全成功重建的機率
比你想像中的
低
接下來開始解釋為什麼,會有硬碟規格和數學,
有心有空看數學流程的,請繼續看下去。沒空或看到數學就頭痛的,
也請聽進我一席話。
二、URE
硬碟有個參數,叫 uncorrectable read error,
更詳細一點的說叫 Non-recoverable read errors per bits read
簡稱ure,其中文為每位元讀取發生無法復原的讀取錯誤
一般消費級硬碟(包括消費級NAS碟),這個參數官方通常是給
1/10E14
(讀做10分之1的14次方,或10的負14次方,或零點零零零零零零零零零零零零零一)
是個看起來很小的值。
什麼意思呢?
平均每讀取100,000,000,000,000位元,就會讀到1位元壞掉、且無法修復的資料。
或是
平均每讀取12.5TB,就會讀到1位元壞掉、且無法修復的資料。
挖靠!這樣看起來更小了。
這個數值大家就先記在心裡。
企業級的硬碟,ure通常是1/10E15甚至1/10E16。
三、RAID 5
再來提提RAID 5。
RAID 5是啥,我就不細說了,不知道的你也不應該組RAID 5...
RAID 5成員其中之一離線後,狀態會變為降級(degraded),
此時,若有備援、或是手動換一顆加入,則會進入重建狀態(rebuild),
重建時,會讀取所有資料,算出離線成員的資料,並寫入備援碟。
所有資料 = RAID 5可用容量,若你拿2TBx3組,就是4TB。
重建是否成功、能否保全資料,就看能否正確的讀取所有資料了。
PS. 一般RAID與檔案系統無關,控制器不會知道你的硬碟哪裡有、放了多少資料。
所以,重建時是對整組RAID、所有磁區去做。
例外是一些軟體層的RAID,本身即是檔案系統、或位於檔案系統之下,
在檔案系統的層級加入RAID概念,是可能只針對有資料的部分做重建的。
如ZFS、ReFS。
四、完美重建成功機率
接下來,就是高中數學了,
我們有
單次事件發生機率 ure
事件次數 = 可用容量
那,我們就能算多次事件下,發生(或不發生)的機率了:
完全不發生ure(不出錯)的機率(完全成功重建)
= (1 - 單次機率) ^ (次數)
= (1 - ure) ^ (容量)
帶入
ure = 1/10E14
可用容量 = 4TB(32x10E12位元)
完全不發生ure的重建機率 = (1-1/10E14)^(32x10E12)
喔數字都好大,怎麼算? 你可以用高級計算機、Excel或是取Log搭配一般計算機。
反正我直接告訴你答案:
使用消費級硬碟組成4TB可用容量的RAID 5,一個位元都不壞的成功重建機率 =
72.6%
順便再多給幾個資料點
4TB = 72.6%
6TB = 61.9%
8TB = 52.8%
我不知道你對這個機率是否滿意。
我個人是很不滿意啦。
若考慮容錯的真義,4TB的狀況對我來說尚可接受。
但在現在單顆4TB性價比如此高,誰會組個4TB的RAID5阿!
當然你可以用企業級、URE較低的硬碟,那是可以把機率提升到90%以上。
但也沒十分高,下面會附上表格。
五、發生read error時
重要:read error和上述的URE不盡相同,但這邊提一下讓大家參考
發生Read error時,根據硬碟與陣列控制卡的行為與設定,會有幾種狀況,
實際的情況比較複雜,我簡單列幾個出來:
1. 硬碟根本沒發現read error!但是讀出來的資料是錯的。
結果:你的資料壞了1bit(通常不止),而且不會主動發現!
嚴重性:看你的資料價值。
2. 硬碟發現Read error,可能是Checksum failed,並開始硬碟內的ERC。
2.a. 修復成功,嚴格說來這樣就不算URE。
2.b. 花過多時間修復,被RAID踢掉。
結果:這顆就離線了,如果你正在重建,恭喜你!RAID Failed!
如果你的RAID無法手動調整RAID組態...那狀況是有點嚴重。
2.c. 因TLER設定而及時放棄修復:
結果:RAID控制器收到錯誤訊息並記錄;
如果有容錯,則會嘗試用其他顆硬碟資料,重建這個位元。
如果容錯失效(如RAID5重建中),則會通常控制器跳過這個位元。
六、RAID 5 完美重建機率
容量
URE 4TB 6TB 8TB 10TB 12TB 14TB 16TB
1E-14 72.63% 61.90% 52.76% 44.96% 38.32% 32.66% 27.83%
1E-15 96.85% 95.32% 93.81% 92.32% 90.85% 89.41% 87.99%
1E-16 99.65% 99.47% 99.29% 99.12% 98.94% 98.76% 98.59%
七、後記
這篇的原稿我是在2013/1/16完成的,
當時我用的是消費級2TBx8,猶豫要上RAID 5還是RAID 6,
於是就查規格、動手算,果斷RAID 6。
有空再分享RAID 6的計算部分。
現在呢?
那些2TB都賣光了XD
今天,因為單身的聖誕節很無聊,
把兩年前的文章整理出來,當作給大家遲來的聖誕禮物吧。
--
Tags:
儲存設備
All Comments
By Valerie
at 2014-12-28T11:19
at 2014-12-28T11:19
By Margaret
at 2014-12-31T12:57
at 2014-12-31T12:57
By Hazel
at 2015-01-04T19:55
at 2015-01-04T19:55
By Rae
at 2015-01-09T06:16
at 2015-01-09T06:16
By Tristan Cohan
at 2015-01-09T20:28
at 2015-01-09T20:28
By Bethany
at 2015-01-13T13:54
at 2015-01-13T13:54
By Hedy
at 2015-01-13T23:07
at 2015-01-13T23:07
By Ethan
at 2015-01-18T16:43
at 2015-01-18T16:43
By Puput
at 2015-01-20T05:30
at 2015-01-20T05:30
By Andy
at 2015-01-24T05:11
at 2015-01-24T05:11
By Sierra Rose
at 2015-01-26T04:08
at 2015-01-26T04:08
By Dora
at 2015-01-30T11:50
at 2015-01-30T11:50
By Genevieve
at 2015-02-03T12:35
at 2015-02-03T12:35
By Elvira
at 2015-02-05T00:52
at 2015-02-05T00:52
By Victoria
at 2015-02-07T17:58
at 2015-02-07T17:58
By Skylar Davis
at 2015-02-12T15:04
at 2015-02-12T15:04
By Ina
at 2015-02-13T14:14
at 2015-02-13T14:14
By Zanna
at 2015-02-18T14:08
at 2015-02-18T14:08
By Mary
at 2015-02-21T16:20
at 2015-02-21T16:20
By Wallis
at 2015-02-24T01:59
at 2015-02-24T01:59
By Skylar Davis
at 2015-02-27T18:00
at 2015-02-27T18:00
By Kyle
at 2015-03-04T12:55
at 2015-03-04T12:55
By Kyle
at 2015-03-05T07:03
at 2015-03-05T07:03
By Dorothy
at 2015-03-08T07:25
at 2015-03-08T07:25
By Tracy
at 2015-03-09T21:33
at 2015-03-09T21:33
By Catherine
at 2015-03-11T19:29
at 2015-03-11T19:29
By Poppy
at 2015-03-12T18:28
at 2015-03-12T18:28
By Christine
at 2015-03-16T02:55
at 2015-03-16T02:55
By Connor
at 2015-03-20T02:09
at 2015-03-20T02:09
By Connor
at 2015-03-22T06:42
at 2015-03-22T06:42
By Ethan
at 2015-03-23T21:10
at 2015-03-23T21:10
By Agnes
at 2015-03-27T18:07
at 2015-03-27T18:07
By Olga
at 2015-03-31T08:14
at 2015-03-31T08:14
By Agnes
at 2015-04-03T19:43
at 2015-04-03T19:43
By Queena
at 2015-04-05T10:52
at 2015-04-05T10:52
By Rachel
at 2015-04-08T02:14
at 2015-04-08T02:14
By Olive
at 2015-04-12T09:49
at 2015-04-12T09:49
By William
at 2015-04-13T03:02
at 2015-04-13T03:02
By Hedy
at 2015-04-15T04:44
at 2015-04-15T04:44
By Heather
at 2015-04-15T21:39
at 2015-04-15T21:39
By David
at 2015-04-16T03:11
at 2015-04-16T03:11
By Lauren
at 2015-04-19T13:59
at 2015-04-19T13:59
By Noah
at 2015-04-19T20:16
at 2015-04-19T20:16
By George
at 2015-04-24T19:37
at 2015-04-24T19:37
By Regina
at 2015-04-26T22:13
at 2015-04-26T22:13
By Freda
at 2015-05-01T07:48
at 2015-05-01T07:48
By Eden
at 2015-05-04T23:19
at 2015-05-04T23:19
By Dinah
at 2015-05-08T09:57
at 2015-05-08T09:57
By Callum
at 2015-05-08T15:51
at 2015-05-08T15:51
By Sandy
at 2015-05-10T19:22
at 2015-05-10T19:22
By Ivy
at 2015-05-11T20:37
at 2015-05-11T20:37
By Lily
at 2015-05-11T23:37
at 2015-05-11T23:37
By Yedda
at 2015-05-14T00:13
at 2015-05-14T00:13
By Candice
at 2015-05-16T01:52
at 2015-05-16T01:52
By Mia
at 2015-05-19T13:00
at 2015-05-19T13:00
By Ursula
at 2015-05-23T18:27
at 2015-05-23T18:27
By Quanna
at 2015-05-26T15:47
at 2015-05-26T15:47
By William
at 2015-05-30T22:56
at 2015-05-30T22:56
By Linda
at 2015-06-04T16:26
at 2015-06-04T16:26
By Rachel
at 2015-06-06T00:52
at 2015-06-06T00:52
By Damian
at 2015-06-07T16:12
at 2015-06-07T16:12
By Mary
at 2015-06-12T07:23
at 2015-06-12T07:23
By Bennie
at 2015-06-14T08:35
at 2015-06-14T08:35
By Agatha
at 2015-06-17T12:29
at 2015-06-17T12:29
By Anonymous
at 2015-06-21T23:08
at 2015-06-21T23:08
By Bennie
at 2015-06-22T21:56
at 2015-06-22T21:56
By Victoria
at 2015-06-25T14:10
at 2015-06-25T14:10
By Rachel
at 2015-06-30T14:00
at 2015-06-30T14:00
By Faithe
at 2015-07-03T06:56
at 2015-07-03T06:56
By Tom
at 2015-07-05T21:01
at 2015-07-05T21:01
By Anthony
at 2015-07-06T01:46
at 2015-07-06T01:46
By Gilbert
at 2015-07-06T22:29
at 2015-07-06T22:29
By Eartha
at 2015-07-09T00:12
at 2015-07-09T00:12
By Zenobia
at 2015-07-10T16:13
at 2015-07-10T16:13
By Queena
at 2015-07-14T15:04
at 2015-07-14T15:04
By Callum
at 2015-07-18T06:53
at 2015-07-18T06:53
By Franklin
at 2015-07-18T10:54
at 2015-07-18T10:54
By Oliver
at 2015-07-21T05:07
at 2015-07-21T05:07
By Ursula
at 2015-07-24T11:07
at 2015-07-24T11:07
By Elvira
at 2015-07-28T16:36
at 2015-07-28T16:36
By Skylar Davis
at 2015-07-30T02:05
at 2015-07-30T02:05
By Damian
at 2015-08-04T00:06
at 2015-08-04T00:06
By Margaret
at 2015-08-08T12:46
at 2015-08-08T12:46
By Margaret
at 2015-08-09T19:39
at 2015-08-09T19:39
By Ina
at 2015-08-10T06:52
at 2015-08-10T06:52
By Ula
at 2015-08-11T14:07
at 2015-08-11T14:07
By Anonymous
at 2015-08-16T08:19
at 2015-08-16T08:19
By Leila
at 2015-08-19T00:31
at 2015-08-19T00:31
By Agatha
at 2015-08-23T15:02
at 2015-08-23T15:02
By Zora
at 2015-08-27T11:33
at 2015-08-27T11:33
By Poppy
at 2015-08-31T14:31
at 2015-08-31T14:31
By James
at 2015-09-03T03:25
at 2015-09-03T03:25
By Olga
at 2015-09-06T18:18
at 2015-09-06T18:18
By Isabella
at 2015-09-07T04:41
at 2015-09-07T04:41
By Regina
at 2015-09-07T10:43
at 2015-09-07T10:43
By Oscar
at 2015-09-09T12:20
at 2015-09-09T12:20
By Ingrid
at 2015-09-11T12:33
at 2015-09-11T12:33
Related Posts
NAS選擇(20000P)
By Skylar Davis
at 2014-12-26T02:33
at 2014-12-26T02:33
NAS選擇
By Lily
at 2014-12-26T01:21
at 2014-12-26T01:21
骨董電腦換SSD...杯具了
By William
at 2014-12-25T23:01
at 2014-12-25T23:01
發現壞軌後越來越讀不到
By Frederica
at 2014-12-25T22:39
at 2014-12-25T22:39
OCZ ARC100 240GB 降價 2990
By Vanessa
at 2014-12-25T20:52
at 2014-12-25T20:52