固態(tài)硬盤(pán) Vs RAID?是否該調(diào)整RAID以支持固態(tài)硬盤(pán)?
wangfei 發(fā)表于:13年07月04日 17:20 [編譯] DOIT.com.cn
我的同事兼好友、存儲(chǔ)分析師雷伊盧凱西(Ray Lucchesi)在最近一篇博客文章中指出,我們現(xiàn)在將固態(tài)硬盤(pán)與有限的寫(xiě)壽命和RAID整合在一起可能是一種危險(xiǎn)的做法。雷伊建議對(duì)固態(tài)硬盤(pán)進(jìn)行調(diào)整,以便讓它們能夠更好地與RAID協(xié)作。
但我認(rèn)為,雷伊剛好說(shuō)反了。我們不應(yīng)該擔(dān)心如何讓固態(tài)硬盤(pán)更好地與RAID協(xié)作。 我們應(yīng)該考慮的問(wèn)題是,是否應(yīng)該對(duì)RAID進(jìn)行調(diào)整或是替換,以支持固態(tài)硬盤(pán)。
雷伊是在拜讀了納西姆尼古拉斯塔勒布(Nassim Nicholas Taleb)的最新暢銷書(shū)《Antifragile:Things That Gain from Disorder》之后寫(xiě)下他的那篇博客文章的。塔勒布是《黑天鵝》(The Black Swan)一書(shū)的作者。塔勒布假設(shè)的前提是:有很多系統(tǒng)不但可以容許故障和其他應(yīng)激物,而且還可以因?yàn)樗鼈兌纳啤?相反,易碎的系統(tǒng)在受到壓力時(shí)就會(huì)出現(xiàn)故障。反易碎的系統(tǒng)實(shí)際上就是那些不能殺死你反而能使你更加強(qiáng)壯的系統(tǒng)。
雷伊擔(dān)心的問(wèn)題是有限的寫(xiě)壽命會(huì)導(dǎo)致多塊固態(tài)硬盤(pán)出現(xiàn)故障,從而造成數(shù)據(jù)丟失的結(jié)果。因?yàn)镽AID是根據(jù)傳統(tǒng)硬盤(pán)而設(shè)計(jì)的,傳統(tǒng)硬盤(pán)實(shí)際上并不會(huì)出現(xiàn)磨損,只是會(huì)隨機(jī)性出現(xiàn)故障,因此雷伊認(rèn)為我們應(yīng)該改善固態(tài)硬盤(pán)以提高它的故障的正常性或隨機(jī)性。 這會(huì)在未來(lái)擴(kuò)大故障的范圍。因此,RAID系統(tǒng)可能會(huì)改造一塊出現(xiàn)故障的固態(tài)硬盤(pán),而且運(yùn)營(yíng)商可以在第二塊固態(tài)硬盤(pán)出現(xiàn)故障之前更換掉已經(jīng)出現(xiàn)故障的固態(tài)硬盤(pán)。
雷伊建議存儲(chǔ)專業(yè)人士和固態(tài)硬盤(pán)廠商對(duì)我們的實(shí)際操作進(jìn)行改良,以便將故障分散化,讓RAID能夠良好運(yùn)行:
這些改良措施尤其是消除磨損級(jí)別可以增強(qiáng)固態(tài)硬盤(pán)故障的隨機(jī)分布。問(wèn)題是,它們也會(huì)減少固態(tài)硬盤(pán)的使用壽命。 我寧愿使用一大堆經(jīng)過(guò)3萬(wàn)次寫(xiě)周期后出現(xiàn)故障的固態(tài)硬盤(pán),也不愿意使用在經(jīng)過(guò)1萬(wàn)次寫(xiě)周期到2.5萬(wàn)次寫(xiě)周期后隨機(jī)出現(xiàn)故障的固態(tài)硬盤(pán)。
由于每一款固態(tài)硬盤(pán)都有SMART(自我監(jiān)控、分析和報(bào)告技術(shù))計(jì)數(shù)器,它不但可以報(bào)告有多少flash頁(yè)面出現(xiàn)過(guò)故障,而且還可以報(bào)告設(shè)備剩余的寫(xiě)壽命還有多少。
如果我們的RAID控制器(當(dāng)我們遷移到軟件定義存儲(chǔ)時(shí),就還包括它們的軟件控制器)只能監(jiān)控這些計(jì)數(shù)器,它們就可以向管理員發(fā)出一條信息,在更好的情況下,它們還可以向廠商的支持團(tuán)隊(duì)發(fā)送一條信息。這些固態(tài)硬盤(pán)在寫(xiě)壽命耗盡之前就可以被替換下來(lái)。
我們面臨的部分問(wèn)題是,我們一直在使用RAID,它已經(jīng)成為我們的存儲(chǔ)根本概念中的一個(gè)根深蒂固的元素。但是RAID本身只是一種問(wèn)題的解決方案。 帕特松、吉布森和卡茨最初提倡RAID是因?yàn)樯a(chǎn)容量更大、速度更快的硬盤(pán)的成本過(guò)于高昂。RAID的設(shè)計(jì)初衷是將一系列廉價(jià)傳統(tǒng)硬盤(pán)整合起來(lái),讓它的容量比一款大容量的昂貴磁盤(pán)的容量更大,速度更快。
固態(tài)硬盤(pán)的速度非常快,因此我們很少需要利用RAID來(lái)提高它們的速度。然而,我們對(duì)可靠性的預(yù)期也提高了,因此我們需要一些冗余來(lái)提高它們的可靠性。 我認(rèn)為,閃存硬盤(pán)與傳統(tǒng)硬盤(pán)是不同的,為了讓它能夠與使用了25年的RAID設(shè)計(jì)協(xié)作,調(diào)整軟件比犧牲閃存硬盤(pán)的優(yōu)勢(shì)更好一些。
為固態(tài)硬盤(pán)和混合環(huán)境建立后RAID數(shù)據(jù)保護(hù)方案應(yīng)該修改舊的鏡像、對(duì)等和雙對(duì)等方案,這樣不僅可以防止設(shè)備出現(xiàn)故障,而且還可以將它們創(chuàng)造的寫(xiě)放大數(shù)值減少到最小程度。避免寫(xiě)數(shù)據(jù)尤其是寫(xiě)入少量數(shù)據(jù)可以延長(zhǎng)固態(tài)硬盤(pán)的使用壽命和可靠性。
這樣就不用消除磨損級(jí)別,因?yàn)楣虘B(tài)硬盤(pán)控制器需要經(jīng)常向空白頁(yè)寫(xiě)入數(shù)據(jù),因此那是很難做到的,他們應(yīng)當(dāng)擴(kuò)展它,將磨損平均分布到一塊固態(tài)硬盤(pán)的所有閃存中,乃至于平均分布到一個(gè)系統(tǒng)中的所有固態(tài)硬盤(pán)中。
如果我們專注于全面減少故障而不是增強(qiáng)故障恢復(fù),我們就能夠得到更高的正常運(yùn)行率。
到底是我提出的解決方案更好,還是雷伊提出的解決方案更明智呢? 歡迎大家各抒己見(jiàn),暢所欲言。
公司簡(jiǎn)介 | 媒體優(yōu)勢(shì) | 廣告服務(wù) | 客戶寄語(yǔ) | DOIT歷程 | 誠(chéng)聘英才 | 聯(lián)系我們 | 會(huì)員注冊(cè) | 訂閱中心
Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技術(shù)有限公司 版權(quán)所有.