背景介紹:

硅谷多家技術(shù)公司顧問Philippe Nicolas貼出了一張有趣的對(duì)象存儲(chǔ)發(fā)展歷程圖片,利用數(shù)據(jù)表細(xì)化出內(nèi)容尋址存儲(chǔ)(CAS)即對(duì)象存儲(chǔ)的發(fā)展歷程。

802表

該圖表匯總了多家企業(yè)不同產(chǎn)品的起源,X軸代表時(shí)間線,Y軸則為企業(yè),項(xiàng)目和產(chǎn)品名稱,并作出評(píng)論和分析。

和很多創(chuàng)新一樣,這個(gè)圖表充分說明,幾乎所有的系統(tǒng)都來自小型廠商。其它IT細(xì)分市場(chǎng)是如此,存儲(chǔ)亦是如此,即便后者始終與硬件和基礎(chǔ)設(shè)施相關(guān)。

圖表中藍(lán)色星標(biāo)代表一些網(wǎng)絡(luò)巨頭發(fā)表的重要論文。這些論文引起了一連串適用于超大規(guī)模環(huán)境的對(duì)象存儲(chǔ)方案的商業(yè)運(yùn)作。

GFS(谷歌文件系統(tǒng)),MapReduce和BigTable加上Hadoop,亞馬遜Dynamo,雅虎MObStor和Facebook Cassandra一直是上圖大多數(shù)公司的主要參考資料。但這些公司并未發(fā)現(xiàn)商用產(chǎn)品能夠充分滿足它們的預(yù)期需求,還不肯為產(chǎn)品和復(fù)雜性的限制大把燒錢,而更樂意基于它們強(qiáng)大的Linux DNA,設(shè)計(jì),構(gòu)建,開發(fā),控制和掌握自身的技術(shù)。

為了方便閱讀,左下方進(jìn)行了標(biāo)注說明。紅圈代表收購(gòu)案,橙圈代表OEM,實(shí)心藍(lán)圈代表開源,空心代表特殊開源,菱形為公司或產(chǎn)品,藍(lán)色星標(biāo)為重要論文,紅色星標(biāo)為項(xiàng)目,橙色為Apache Hadoop(開源軟件架構(gòu)),綠色星標(biāo)代表產(chǎn)品。

第一波浪潮

我們可以清楚地看到1998年到2005年CAS廠商帶來的首波浪潮。FilePool公司顯然走在該行業(yè)的前列。該公司設(shè)計(jì)了一種全新的方式對(duì)大量數(shù)據(jù)進(jìn)行長(zhǎng)期有效存儲(chǔ)。這一舉措同時(shí)也拉開了磁盤數(shù)據(jù)歸檔的序幕。

此外,圖表還列出了Bycast, Evertrust, Permabit, Archivas, Sun(擁有Honeycomb項(xiàng)目——針對(duì)固定內(nèi)容歸檔的技術(shù))公司以及極具潛力的Caringo公司,它為CAS和后期的對(duì)象存儲(chǔ)階段之間架起真實(shí)的橋梁。

而為了說明這個(gè)擁有大好前程細(xì)分市場(chǎng)的魅力,幾乎所有廠商都被收購(gòu)了。

比如:

2001年,F(xiàn)ilePool被EMC收購(gòu)成為Centera產(chǎn)品;

2013年,Evertrust被Nexsan收購(gòu),更名為Assureon,然后它又在2013年被Imation以1億美元吞并;

2007年,Archivas 被HDS以1.2億美元收購(gòu)變?yōu)镠CP(日立內(nèi)容平臺(tái)),2010年,Bycast被NetApp收購(gòu)。

第二波浪潮

第二波浪潮是在2004/2005年到2009年,這個(gè)時(shí)期出現(xiàn)了真正的對(duì)象存儲(chǔ)先鋒。該時(shí)期和之前定義的CAS時(shí)代有小部分重疊。主要的廠商為Caringo, Cleversafe, B-Virtual則變?yōu)锳mplidata, Compuverde, DDN(Bucket File System),而在2015年,Redcurrant項(xiàng)目分支出了OpenIO公司。

我們同樣列出了Ceph和Gluster,這兩個(gè)開源項(xiàng)目很有名,在市場(chǎng)上也備受矚目,后期被紅帽收購(gòu),Ceph是2014年通過Inktank以1.75億美元收購(gòu),而Gluster則早在2011年就被紅帽以1.36億美元收購(gòu)。在2003年,紅帽就已經(jīng)開啟它的存儲(chǔ)收購(gòu)戰(zhàn)略,以3300萬美元收購(gòu)Sistina公司用于其集群卷管理器和文件系統(tǒng)。

這一時(shí)期也是為保護(hù)數(shù)據(jù)提供更好數(shù)據(jù)完整性和持久性的新存儲(chǔ)方式正式亮相,糾刪碼方案,通過Cleversafe和Amplidata得到改善。2006年,也是Amazon S3元年,它是由亞馬遜推出的破壞性存儲(chǔ)模式,徹底改變了IT世界。這款云存儲(chǔ)產(chǎn)品只需簡(jiǎn)單訂閱即可通過網(wǎng)絡(luò)進(jìn)行遠(yuǎn)程訪問。隔年Nirvanix推出,旨在處理市場(chǎng)企業(yè)級(jí)部分的問題。

第三波浪潮

第三波變革出現(xiàn)在2008/2009年至今,出現(xiàn)了大量的開源項(xiàng)目和產(chǎn)品例如:

OpenStack Swift;

Skylable;

Manta(來自Joyent公司);

Minio;

OpenIO;

Ambry(來自LinkedIn公司);

Torus;

Microsoft Azure;

Google Cloud Storage。

這對(duì)大數(shù)據(jù)和一些瞄準(zhǔn)企業(yè),電信運(yùn)營(yíng)商或服務(wù)提供商內(nèi)部部署需求的商用產(chǎn)品起到了真正的促進(jìn)作用。這里我們可以看到一些打算構(gòu)建并提供新的數(shù)據(jù)存儲(chǔ)平臺(tái)的廠商,采用多個(gè)訪問協(xié)議或方法作為最終的整合因素。

開始雖然你擁有糾刪碼和訪問法的特性有助于形成對(duì)比,但想要差異化的解決方案還是很難。一些廠商增加了HDFS(分布式文件存儲(chǔ))連通性,而Hortonworks公司提出了Ozone項(xiàng)目(Hadoop對(duì)象存儲(chǔ)環(huán)境),說明所有這些系統(tǒng)的可能性融合。最終,HDFS只是一個(gè)訪問法。

這一時(shí)期可能是三波浪潮中最為活躍的時(shí)期,包含了絕大多數(shù)的開源解決方案。

在2000年,全球只有四款產(chǎn)品存在——FilePool, Bycast, Evertrust和Permabit?,F(xiàn)在全部銷聲匿跡——三家被收購(gòu)(一些產(chǎn)品仍在進(jìn)行開發(fā),比如NetApp StorageGRID來自Bycast),Permabit在2011年停產(chǎn)。2010年,約有超過30款產(chǎn)品,其中包含一些開源產(chǎn)品。而現(xiàn)在,因?yàn)殚_源,市場(chǎng)上有超過45個(gè)系統(tǒng)發(fā)售。

而開源始于2004年Ceph,在2008年加速前行,現(xiàn)在有16個(gè)開源系統(tǒng)包含在上述的45個(gè)系統(tǒng)中。

收購(gòu)方面,近幾年來對(duì)成立五年以上的公司進(jìn)行收購(gòu)已然屢見不鮮。這在上圖有了極好地表現(xiàn)。最大的收購(gòu)案就是IBM在嘗試競(jìng)購(gòu)Amplidata無果之后拿下了Cleversafe。

經(jīng)驗(yàn)匯總

從這段CAS與對(duì)象存儲(chǔ)發(fā)展進(jìn)程里得出的經(jīng)驗(yàn)教訓(xùn):

HTTP已經(jīng)證實(shí)了它在存儲(chǔ)即傳輸協(xié)議中的價(jià)值;

S3成為實(shí)際意義上的市場(chǎng)標(biāo)準(zhǔn);

采用x86商用服務(wù)器存儲(chǔ)是現(xiàn)實(shí)的,這個(gè)軟件定義存儲(chǔ)的出現(xiàn)已證實(shí)。而糾刪碼是一個(gè)必須條件,尤其在大規(guī)模環(huán)境;

開源是現(xiàn)實(shí)的,它可以更方便快速地應(yīng)用于高容量系統(tǒng);

另外,不要忘記文件,它始終存在;

微軟除了Azure完全沒存在感;

Veritas,長(zhǎng)期數(shù)據(jù)和存儲(chǔ)管理巨頭,從賽門鐵克拆分之后保持獨(dú)立狀態(tài),也因?yàn)槿狈Ξa(chǎn)品而被踢出局;

最后,我們可以重新審視小型廠商和團(tuán)隊(duì)的創(chuàng)新。存儲(chǔ)對(duì)這一規(guī)則也非例外。

分享到

崔歡歡

相關(guān)推薦