任新勃 發(fā)表于:13年08月30日 17:00 [綜述] DOIT.com.cn
ReadyDATA 516使用的是ZFS文件系統(tǒng)。作為目前最頂尖的文件系統(tǒng)之一,基于ZFS的ReadyDATA 516提供眾多數據安全特性。傳統(tǒng)文件系統(tǒng)(如ext3/4)就近覆蓋數據,這意味著如果系統(tǒng)斷電(例如,在分配數據塊到將其鏈接到目錄中的時間段內斷電),則會使文件系統(tǒng)處于不一致狀態(tài)。以前,此問題是通過使用fsck命令解決的。此命令負責檢查并驗證文件系統(tǒng)狀態(tài),并嘗試在操作過程中修復任何不一致性。但fsck命令并不保證能夠解決所有可能的問題。后來,文件系統(tǒng)引入了日志記錄的概念(ext3相比ext2的好處)。在單獨的日中記錄操作,在系統(tǒng)發(fā)生崩潰時,可以安全地重放該日志。由于數據需要寫入兩次,因此該過程會引入不必要的開銷,而且通常會導致一組新問題,例如在無法正確地重放日志時。對于事務性文件系統(tǒng),數據是使用寫復制語義管理的。數據永遠不會被覆蓋,并且任何操作序列會全部被提交或全部被忽略。因此,文件系統(tǒng)絕對不會因意外斷電或系統(tǒng)崩潰而被損壞。盡管最近寫入的數據片段可能丟失,但是文件系統(tǒng)本身將始終是一致的。此外,只有在寫入同步數據(使用O_DSYNC標志寫入)后才返回,因此同步數據決不會丟失.
校驗與自我修復數據
根據CERN進行的為期5周的實驗,每1TB的數據,平均發(fā)現3個損壞的文件。隨著容量的增大和操作時間的增長,此情況將會更糟。而此情況對于SATA硬盤來說,發(fā)生的概率是非常高的。文件損壞是什么概念?對于JPEG圖片來說,也許就是一張圖片里面有一個黑點,這影響不大,但是如果是你的ERP數據,你的網上訂單數據,那么,損壞幾個文件造成的交易損失將會是慘重的。對于RDD516來說,它支持校驗和和自我修復數據,具體的做法是:當你寫入一個文件的時候,將會寫入許多數據塊,每一個數據塊除了自身的數據之外,還會有其子數據塊的校驗值,這樣就保證了兩點,第一是子數據塊的數據肯定是正確的,第二點是子數據塊的地址是正確的。
那如果這時候某個數據塊壞了怎么辦?這就是RDD516的自我數據修復功能,只要你做了有冗余的RAID級別,那么RDD516將會自動從冗余的副本里面找到正確的數據。
高效率特性:重復數據刪除, 數據壓縮, 無限制快照
也許,RDD516在該級別產品里面,最獨一無二的,就是其支持無限制快照,重復數據刪除和數據壓縮功能。重復數據刪除,一般都是大型存儲設備獨有的功能,比如EMC, NetAPP等公司的產品。并且一般需要支付license才能使用。在面向中小企業(yè)的產品里面,支持重復數據刪除功能的產品,RDD516還是我們見到的第一個。重復數據刪除的作用,就是不會在存儲里面保存兩份同樣的數據。典型的使用場景是,你運行每周定期備份,而備份的文件又絕大多數沒有改變,這樣子可以節(jié)省極大的空間。RDD516的重復數據刪除是基于塊級別的inline做法。也就是說,重刪的計算是在數據到達存儲的時候進行的,當RDD516發(fā)現一個冗余數據塊的時候,它將只會創(chuàng)建一個指針并且指向已有的數據塊。
那么重刪在什么地方能夠應用得到:
虛擬化應用:多個虛擬機安裝同個版本的操作系統(tǒng)(比如Windows Server 2008 R2),而這個系統(tǒng)共享相同的kernel,庫文件,系統(tǒng)文件,系統(tǒng)應用,通過使用重刪,這些文件將只會保留一份,當然,多個虛擬機系統(tǒng)是可以同時訪問這些文件的。
文件服務器:這取決于具體你的用戶存放的是什么文件。對于企業(yè)用戶來說,更多的是存放協同分工合作的文檔,有很大的可能這些文件是同個文件的不同版本,這樣子也會節(jié)省很大的空間。
郵件服務器: 和文件服務器類似,對于郵件服務器來說,在企業(yè)環(huán)境下,經常會有同事抄送其工作成果給同個組員,領導等,這樣子一份文件會保存少則幾份,多則幾十幾百份。使用重刪可以急劇減少空間占用。備份到硬盤(B2D):多人備份數據到硬盤,這也有很大的可能性會有相同數據的不同副本:應用,系統(tǒng)文件,文檔,圖片等等。
Web 2.0 和社交網站: 對于社交網絡來說,人們關注相同的熱點,當幾萬人轉發(fā)相同的主題,共享相同的熱點的時候,這時候又有大量冗余數據產生,此時重刪又能發(fā)揮作用。
如果說重復數據刪除是基于塊級別的,那么數據壓縮就是基于比特(bit)級別的。相比較重復數據刪除,我們對壓縮應該是更為熟悉的。比如咱們常用的Windows平臺上的WinRAR就是這樣的壓縮軟件。從實際測試效果來說,壓縮的節(jié)省空間大小,跟重刪其實是差不多的。并且其具備一個優(yōu)點,就是對資源的占用相對來說是較小的。
RDD516支持無限制快照,這個功能對于我們來說,簡單點說就是可以找回過去任意時間點的數據,比如你在工作日的每天都執(zhí)行了一個快照,你這一周都在修修補補一個設計圖,等到周五的時候,你突然覺得似乎周一的那個版本更好些,你還能找回來嗎?通過訪問周一執(zhí)行的快照,你就可以找回這份文檔了。
桌面上的數據中心
虛擬化應用的數據倉庫
ReadyDATA 516支持iSCSI和NFS來作為VMware的數據倉庫。并且已經經過了VMware ESXi,微軟Hyper-V和Citrix XenServer的認證。RDD516有兩個特性非常適合運用于虛擬化環(huán)境:Thin Provisioning和虛擬網絡配置。比如你要配置4個VM,每個VM的虛擬硬盤要配置為2TB,對于不支持Thin Provisioning的設備來說,只能一開始就分配8TB的總空間給VM,然后NAS功能就只能使用余下的空間。如果支持Thin Provisioning,容量將會按照實際使用來分配,也就是,你裝完VM的系統(tǒng)之后,寫1M數據才會實際分配1M數據。這樣的好處是,按需分配,NAS功能可以充分利用剩余的空間,也可以延遲硬盤采購,按需購買。RDD516支持虛擬網絡配置,可以在1個網卡上面虛擬出多個虛擬網卡,而VMware等虛擬機也支持虛擬網卡,如果一個VM配置一個虛擬網卡,以不同網段來直連到RDD516,安全性將會更佳。
備份到硬盤,并利用基于云的連續(xù)數據保護實現容災
中小企業(yè)用戶常見的存儲需求是將用戶的數據備份到存儲上面,比如每個人的工作目錄,郵件等等。使用的工具可以是Windows自帶的備份軟件,也可以是專業(yè)的備份軟件,比如來自Acronis, Quest, StorageCraft, Symantec, VEEAM的備份軟件。而RDD516兼容主流的備份軟件,可以作為這些軟件的備份目標的。但是,這只是第一步,RDD516內置一個基于云來進行管理的連續(xù)數據保護功能。你可以將已經備份的文件,再通過云備份到遠程站點。遠程站點可以是另外一臺RDD516,也可以是NETGEAR的RD5200.
同樣的,對于虛擬化環(huán)境來說,存放在RDD516上面的VM,可以通過ReadyDATA Replicate將數據備份到另外一個站點來實現容災:
想象這么一個場景,一家設計公司,20-50個雇員,使用虛擬化搭建內部的服務:一個WEB服務器來展示公司的設計作品,一個Exchange服務器來擔任郵件服務器和通訊錄,一個即時通訊平臺,還需要共享數據的文件服務器。每個虛擬機,都將數據存放在ReadyDATA 516上面,利用ReadyDATA 516的重刪來節(jié)省空間,使用基于云的備份來實現容災和連續(xù)數據保護。對于設計師來說,更偏向于使用Mac OS X系統(tǒng),而其他人可能習慣于Windows系統(tǒng),沒問題,ReadyDATA 516支持SMB,AFP,NFS,無論是什么平臺,都可以在RDD516上面訪問相同的數據。
結語
我們沒有在存儲行業(yè)中看到同時滿足以下要求類似的產品:配置簡單,支持眾多企業(yè)級特性(重刪,自動精簡配置,無限制快照,壓縮),支持云備份,面向中小企業(yè)的價位。EMC, NetAPP, HP, Dell有支持重復數據刪除, Thin Provisioning等功能的產品,但是他們一般都是一個大的機架式產品,動輒幾百個硬盤的配置不是中小企業(yè)用戶所能負擔的,而且這些功能一般都是要另外購買許可證的。
ReadyDATA 516基于Solaris系統(tǒng),而Solaris是運行ZFS文件系統(tǒng)的原生平臺,也是最佳的平臺。相比較將ZFS fork到Linux的做法,直接使用Solaris系統(tǒng)將能保證最佳性能和最高的穩(wěn)定性。也因其高級數據特性,我們認為對于中小企業(yè)用戶來說,ReadyDATA 516是一款非常特別的產品,應該能勝任你的需要。
最后,ReadyDATA516的配置界面非常友好,基本上幾十分鐘以內就能實現初始的部署和配置。