在當(dāng)天下午舉行的“云生態(tài)下的閃存加速創(chuàng)新”分論壇上,存儲(chǔ)領(lǐng)域知名研究者西瓜哥發(fā)表了主題演講,他從第三方市場(chǎng)機(jī)構(gòu)、用戶、廠商以及自身的研究角度,對(duì)全閃陣列的歷史、現(xiàn)狀與發(fā)展進(jìn)行了闡述。西瓜哥表示,未來(lái)閃存的價(jià)格繼續(xù)下降,企業(yè)生產(chǎn)數(shù)據(jù)都會(huì)放在傳感器上。但是真正的歸檔和備份,能不能以后也要利用,主要就是看它的發(fā)展。預(yù)計(jì)到2020年前后,所有生產(chǎn)業(yè)務(wù)會(huì)邁進(jìn)全閃存時(shí)代。

以下為演講實(shí)錄。

我叫西瓜哥,他們叫我CHO。今天下午技術(shù)的東西不多,主要就是忽悠的。今天這堂就是聽(tīng)我研究的結(jié)果,我給大家提供數(shù)據(jù)。我今天的內(nèi)容分幾方面,AFA定義、演進(jìn)、市場(chǎng)、技術(shù)、未來(lái)。

全閃存的定義,業(yè)界沒(méi)有標(biāo)準(zhǔn)的定義,有一個(gè)定義是演進(jìn)。2014年Gartner出了固態(tài)陣列的固態(tài)象限,為什么不用全閃存的陣列定義呢?它認(rèn)為現(xiàn)在閃存目前是主流的形態(tài),但是以后可能會(huì)有相變存儲(chǔ),可能會(huì)有新的固態(tài)介質(zhì),覺(jué)得陣列名字有點(diǎn)窄,為了以后發(fā)展用了SSA的定義,就是固態(tài)陣列的定義。它和IDC認(rèn)為這樣的陣列不能接磁盤,必須得全部配合閃存,作為獨(dú)立的產(chǎn)品進(jìn)行銷售。原來(lái)很多的廠商有混合陣列,可以配閃存,但是都不算在里面的。

IDC的定義,IDC叫AFA?,F(xiàn)在的固態(tài)陣列說(shuō)白了基本都是閃存,幾年前個(gè)別用RAID,以后能怎么講不好說(shuō),但是IDC定義有變化。IDC要求陣列產(chǎn)品只能配閃存的,但是它還有一個(gè)要求,從血緣上講有三種類型。第一種類型就是這個(gè)陣列天生是為閃存設(shè)計(jì)的,第二種類型這些陣列是核陣列改造的,但是會(huì)有一定的優(yōu)化?;萜諏?duì)全閃存的陣列,它的控制器和內(nèi)存和CPU更強(qiáng)大一些。第三個(gè)類型是全閃存配置,這是IDC新加的類型。我們可以看到IDC分類里面,去年閃存的存儲(chǔ)有服務(wù)器,把這樣的全閃存的配置沒(méi)有放在AFA理念,它跟全閃存的陣列相比差距沒(méi)有那么大。剛開(kāi)始重刪,壓縮等等性能差了很大,后來(lái)發(fā)現(xiàn)這個(gè)差距在縮小,甚至有的沒(méi)有太大的差距。在新的定義里面,今年5月份重新修改,把全閃存的配置放在AFA里面去。因?yàn)榘裦lash算在里面,所以說(shuō)份額增長(zhǎng)的很快。

我把全閃存陣列做了研究,國(guó)內(nèi)華為做的比較早,所以我把它放在里面。08年以后在企業(yè)級(jí)的市場(chǎng)閃存用的很少,企業(yè)市場(chǎng)用的都是內(nèi)存加電磁保護(hù)來(lái)做的。真正閃存到企業(yè)的高端市場(chǎng),比較典型的標(biāo)志就是2008年高端存儲(chǔ)引入。

但是閃存發(fā)展,純閃存陣列的元年我認(rèn)為是2012年。當(dāng)時(shí)他們推出了純閃存的產(chǎn)品,他們只是打一些性能市場(chǎng),很多的產(chǎn)品是可靠性是一般的,主要問(wèn)題性能。國(guó)內(nèi)2012年華為賽門鐵克推出了Dorado,這算國(guó)內(nèi)做的比較早。但是華為后來(lái)落后,因?yàn)楹髞?lái)閃存的市場(chǎng)中國(guó)沒(méi)有起來(lái)。華為目前國(guó)內(nèi)市場(chǎng)還是大的,但是后來(lái)的研發(fā)重心還是切到了國(guó)內(nèi)。

2012年可以看到新的閃存時(shí)代,原來(lái)講究性能閃存很貴的,但是講究經(jīng)濟(jì)的話我們看到很多的廠商有特點(diǎn),它們都是支持很強(qiáng)的數(shù)據(jù)疏解功能,一般的時(shí)候會(huì)重刪,一下子閃存的有效成本降低到5美金以下,所以一下子會(huì)把閃存熱潮推向市場(chǎng),因?yàn)橛谐杀镜男б妗?/p>

我們看到2013年Maminaric打破世界紀(jì)錄,打破了高端存儲(chǔ)壟斷的要求,標(biāo)志了純閃存陣列得到了認(rèn)可。2013年行業(yè)紛紛覺(jué)醒,傳統(tǒng)巨頭紛紛推出自己的陣列產(chǎn)品。IBM收購(gòu)tms。2014年有一個(gè)新的標(biāo)志事件,Gartner發(fā)布報(bào)告固態(tài)陣列的象限報(bào)告。2015年,我們看到很多的混合陣列廠商把握不住,2014年的時(shí)候我也講過(guò)了,我也是混合陣列的鼓吹者,我認(rèn)為混合陣列就夠了。但是現(xiàn)在我發(fā)現(xiàn)由于分析師的定義,分析師不認(rèn)為混合陣列就可以。這些國(guó)際廠商紛紛推出純閃陣列的形態(tài),改變了他們?cè)瓉?lái)的想法。他們想進(jìn)入市場(chǎng)。未來(lái)怎么樣不好說(shuō),HDS推出HFS,國(guó)內(nèi)的廠商落后很多。

黃色的三個(gè)階段,這是我認(rèn)為比較重要的三個(gè)階段。1.0時(shí)代、2.0時(shí)代、3.0時(shí)代,原來(lái)是性能,后來(lái)是通用的目的,大家的看法基本上都是差不多的。全閃存的定義,在Gartner像一個(gè)爬坡體,需要2-5年的時(shí)間會(huì)轉(zhuǎn)到大規(guī)模的應(yīng)用。它把固態(tài)陣列作為革命性的技術(shù),一共有三個(gè)技術(shù),重刪和固態(tài)陣列等。IDC有四個(gè)關(guān)鍵的技術(shù),閃存是一個(gè)。

Gartner最新的報(bào)告里面,魔力象限我們可以看到左邊的這是Gartner的研究,會(huì)根據(jù)市場(chǎng)的產(chǎn)品影響力和元件有四個(gè)象限,EMC、IBM、惠普,國(guó)內(nèi)的話只有華為。右邊的IDC的研究,分法也是類似,分領(lǐng)導(dǎo)者和主要玩家。我們這里面看到的廠商更少一些,主要是國(guó)外的廠商,國(guó)內(nèi)的廠商不是很多,每一個(gè)圓球代表了市場(chǎng)的份額,而且每一個(gè)廠商打著這么一款代表性的產(chǎn)品出來(lái),反映了市場(chǎng)的廠商革命。Gartner還有一個(gè)報(bào)告固態(tài)陣列對(duì)產(chǎn)品的報(bào)告,國(guó)內(nèi)的廠商是最低的。報(bào)告里可以看到,全閃存陣列的主要業(yè)務(wù)場(chǎng)景,在線的處理和數(shù)據(jù)庫(kù)的場(chǎng)景,服務(wù)一體化,高性能計(jì)算,還有分析,VDI等等,這是全閃陣列最主要的場(chǎng)景。把全閃存陣列分了性能、存儲(chǔ)效率、可靠性等等分成了不同的特性,每一個(gè)特性有不同的權(quán)重需要總分加起來(lái)和前方產(chǎn)品排名。閃存陣列性能很重要占90%,可靠性和管理性,這也是超過(guò)了兩位數(shù)的,這是報(bào)告的內(nèi)容。我們把紅色標(biāo)出來(lái),這是廠商認(rèn)為得分最高的地方,大家可以看一下單項(xiàng)冠軍。

Brand調(diào)查公司,這跟市場(chǎng)份額沒(méi)有關(guān)系。比如說(shuō)你認(rèn)為這個(gè)市場(chǎng)的領(lǐng)導(dǎo)者是誰(shuí)?你認(rèn)為價(jià)格的領(lǐng)導(dǎo)者是誰(shuí)?惠普是性能的領(lǐng)導(dǎo)者,IBM是可靠性的領(lǐng)導(dǎo)者,服務(wù)的領(lǐng)導(dǎo)者也是EMC。這是用戶的想法而已,從用戶的角度看問(wèn)題。

DCIG報(bào)告是業(yè)界的爭(zhēng)議比較大,就是根據(jù)閃存陣列的參數(shù),你寫幾個(gè)端口,根據(jù)參數(shù)評(píng)分,它認(rèn)為是完全客觀的,沒(méi)有任何的問(wèn)題。每一個(gè)權(quán)重不一樣,打的分也是不一樣的。我們看到得分跟大家想象的可能不太一樣,比如說(shuō)惠普得分還是很高的,但是沒(méi)有問(wèn)題。EMC是市場(chǎng)上賣的最貴的,這是根據(jù)規(guī)格功能直接打分打出來(lái)的。

我們可以看到全閃存陣列的占比,在全球從2013年有一點(diǎn),2014年和2015年占比越來(lái)越大,增長(zhǎng)率特別高,但是目前沒(méi)有超過(guò)20%,大概是16%左右。我們看到中國(guó)的全閃存陣列占比比國(guó)外少很多,我們中國(guó)的全閃存陣列市場(chǎng)沒(méi)有起來(lái),占比上我們就可以看出來(lái)。存儲(chǔ)市場(chǎng)中國(guó)大中華區(qū)占9%,我們的體量落后整個(gè)存儲(chǔ)。但是從EMC全球數(shù)據(jù)來(lái)看,它跟高端存儲(chǔ)的比例已經(jīng)差不多是4:6的比重,體量上講已經(jīng)完全可以跟高端抗衡。

這是我統(tǒng)計(jì)的Q1全球TOP3的情況,EMC、NetApp、HPE是前三。大家看增速,增速比較快的還是前面的三家,我們看到IBM增速慢一些,雖然在增長(zhǎng)但是就是慢了一些。我們可以看到協(xié)議的對(duì)比,目前用的最多就是手機(jī)上和linux。平均的容量售價(jià),十萬(wàn)美金一套。IDC有報(bào)告,全閃存陣列成為主流應(yīng)用,一個(gè)廠商一個(gè)產(chǎn)品就可以進(jìn)入全球TOP10,這是標(biāo)志性的事件。這是IDC的數(shù)據(jù),這是修訂前和修訂后的對(duì)比,預(yù)計(jì)會(huì)保持比較快的增長(zhǎng)。

中國(guó)2015年火起來(lái),中國(guó)全閃存陣列火起來(lái)靠中國(guó)的股票市場(chǎng)影響,股民交易量上漲,迫于壓力,很多的公司買了全閃存陣列很多,主要就是這個(gè)。但是在中國(guó)我們看到了均價(jià)是十萬(wàn)美金,賣的比較貴。

全閃存陣列和普通的陣列區(qū)別就是介質(zhì)不同,我們看到了新的全閃存陣列廠商基于RAID? 2.0技術(shù),閃存先切塊而不是說(shuō)用RAID傳統(tǒng)的方式。很多的廠商推出了多維的方式,比較明顯的就是閃存的盤里用了一層,閃存硬盤之間又做了一層,這是相對(duì)于兩維的東西。EMC做的更好,可以解決很多問(wèn)題。硬盤越來(lái)越大,現(xiàn)在有15PB的,為了怕出事很多的進(jìn)行校驗(yàn)?,F(xiàn)在很多的廠商在研究閃存陣列通過(guò)全局的GFTL解決性能的問(wèn)題。作為陣列來(lái)講,如果說(shuō)每一個(gè)SSD都自己搞效率很低,如果說(shuō)全世界搞的話可能會(huì)效率提高很多,所以現(xiàn)在很多的廠商在這方面有研究。

閃存跟硬盤是一樣的,都喜歡寫的快,大一些,順序?qū)?,這樣的效率是最好的。并不是說(shuō)閃存隨機(jī)性能很好,但是數(shù)據(jù)寫的更快一些。這個(gè)條帶修改的時(shí)候,只修改某一個(gè)塊怎么辦,我永遠(yuǎn)不要修改原來(lái)的數(shù)據(jù),主要修改的東西都會(huì)重新的寫,我只是把要改的數(shù)據(jù)塊標(biāo)為不用就可以。這樣的話每一次寫就會(huì)很方便,節(jié)省時(shí)間。垃圾回收問(wèn)題,每一個(gè)硬盤自己做垃圾回收的話,其實(shí)有的時(shí)候性能會(huì)有抖動(dòng),如果說(shuō)控制的話利用智能算法會(huì)避免這些抖動(dòng)。如果同時(shí)垃圾回收就會(huì)滿了,如果每次做三個(gè),我自己調(diào)動(dòng)好的話只做三個(gè)盤子的垃圾回收,這樣的話系統(tǒng)性能就會(huì)錯(cuò)開(kāi),就不會(huì)大家一塊做,把垃圾回收的控制觸發(fā)功能放在系統(tǒng)這兒。

冷熱數(shù)據(jù)分離,大家知道我們的源數(shù)據(jù)是很熱的,我們現(xiàn)在的閃存最主要的就是源數(shù)據(jù)。有的時(shí)候跟真實(shí)的數(shù)據(jù)和冷數(shù)據(jù)分開(kāi),不要寫在一個(gè)塊里,但是這樣的話垃圾回收的時(shí)候會(huì)減少工作量。傳統(tǒng)的陣列就是在垃圾回收會(huì)做特殊的優(yōu)化,其它的功能我認(rèn)為和陣列差別不是很大,有一些差別,但是沒(méi)有根本的差別。

原來(lái)2014年的夢(mèng)想是混合陣列一統(tǒng)天下,沒(méi)有必要做閃存陣列。我覺(jué)得閃存陣列優(yōu)化的好,但是不配硬盤就是一個(gè)閃存的陣列,這是當(dāng)時(shí)的夢(mèng)想。但是現(xiàn)在我的觀點(diǎn)有一些變化,男女搭配干活不累?,F(xiàn)在閃存的成本,裸容量的成本很高,所以說(shuō)沒(méi)有必要搞的那么復(fù)雜。IDC報(bào)告里面我們可以看到,它現(xiàn)在也認(rèn)可混合陣列性能跟閃存陣列是一樣的。

未來(lái)閃存的價(jià)格繼續(xù)下降,企業(yè)生產(chǎn)數(shù)據(jù)都會(huì)放在傳感器上。但是真正的歸檔和備份,能不能以后也要利用,主要就是看它的發(fā)展。因?yàn)閴嚎s的備份,它對(duì)重刪的壓縮不需要實(shí)時(shí)的,所以說(shuō)你這個(gè)閃存陣列重復(fù)壓縮我也是可以支持的。容量上有優(yōu)勢(shì)會(huì)更加接近,再加上功耗的空間,以后數(shù)據(jù)中心就很方便。2020年左右,所有生產(chǎn)業(yè)務(wù)會(huì)邁進(jìn)全閃存時(shí)代,備份和歸檔的差距一時(shí)半會(huì)閃存顆粒還是降不下來(lái)。

分享到

zhoub

相關(guān)推薦