EMC公司大中國區(qū)產(chǎn)品銷售及技術總監(jiān)杜國強先生在會上發(fā)表了《全面的信息基礎架構》的主題演講,以下是演講內(nèi)容全文。
EMC公司大中國區(qū)產(chǎn)品銷售及技術總監(jiān)杜國強先生
我今天想跟各位匯報全面的信息基礎架構,除了跟各位匯報一些發(fā)展的趨勢和新的技術之外,我會探討一個特殊的課題??綠色。從十一五的重要規(guī)劃,建設資源節(jié)約型社會,希望在“十一五”相對“十五”單位能耗GDP相對降低20%。
談到信息存儲,大家會想到硬盤,平均一個硬盤消耗22瓦,一個服務器3個硬盤消耗66瓦,目前一個存儲系統(tǒng)里面可能有上千個硬盤。前幾天我看到一個報告,美國一些大型的數(shù)據(jù)中心一年的耗電量是2萬千瓦,大概是普通老百姓25000戶一年的耗電量。
今天我在與各位探討信息基礎架構。在各種技術、各種IT技術以外,各位可以探討,國家大的戰(zhàn)略規(guī)劃、全球能源資源短缺、從國家的戰(zhàn)略如何看待信息存儲或信息架構。我們除了提升價值降低成本以外,可能也要開始從能耗角度考慮問題。我今天會在不同地方跟各位提到這個事情。
這有一個簡單的圖,從分散的存儲架構、IT架構,或者到整合的IT信息架構,這樣的轉(zhuǎn)變可以只花1塊做到,也可以花好幾千萬。全球有一個大企業(yè),花了540億美金來完成這樣一個步驟,從分散的架構到以信息為核心的架構,企業(yè)總裁是喬治?布什。
為什么發(fā)生這事情,2001年的9.11事件,兩個恐怖分子以學生身份進來的,這表示外交部、教育部、發(fā)簽證的大使館,美國CIA,很多信息沒有交流,9.11以后美國安全部用540億美金完成信息基礎架構的整合。一個企業(yè)可能花1塊、1百萬、1千萬完成這樣的架構,這樣的架構如何考慮,這是我今天跟各位探討的。
在這之前探討什么叫信息架構,去年最熱的話題就是《達?芬奇密碼》,有一個密碼叫羅丹密碼,羅丹在1882年想到信息架構如何來做,這張圖《思想者》,企業(yè)的信息、CIO、CFO等,也就是企業(yè)的領導想如何在明天為企業(yè)帶來更大的利潤。
他坐在企業(yè)雜亂無章的數(shù)據(jù)中說,信息基礎架構就是在最快的時間把這些雜亂無章的數(shù)據(jù)提升成信息,進而在最快的時間把信息提升成為知識,用最快的時間變成知識。各位坐過飛機,服務員就是以最快時間給你需要的東西,比如我需要可樂,不是在最快時間給你雪碧而是給你可樂?,F(xiàn)在就是要把企業(yè)的數(shù)據(jù)在最快時間變成智慧,這家企業(yè)知道的客戶行為,競爭對手不知道。
從這么多年信息的發(fā)展,存儲的發(fā)展,從以前簡單的SAN到NAS到網(wǎng)絡連接,各種不同的技術都出來了,在這樣的技術出來之后,這樣的發(fā)展到底會發(fā)展到哪里去?
首先簡單的是數(shù)據(jù)的復制、數(shù)據(jù)的克隆,到目前很熟悉的話題CDP,各位也很清楚,在做數(shù)據(jù)復制、數(shù)據(jù)傳輸是通過TCP/IP這條路,網(wǎng)絡存儲出來以后,數(shù)據(jù)存儲通過網(wǎng)絡存儲,這速度4GB獨享和10GB分享,這速度的差距多大。
全球最大的信用卡公司,每十分鐘可以把交易數(shù)據(jù)做交易倉庫做欺詐偵測系統(tǒng),如果各位用那家信用卡公司的信用卡,理論上只有10分鐘作案的機會,因為10分鐘就會偵測到你使用的假信用卡。這技術是五年前十年前基于網(wǎng)絡的存儲傳輸?shù)轿涣?,現(xiàn)在發(fā)現(xiàn)越來越重要。
因為A銀行比B銀行能夠提早一天,知道客戶行為我就立于不敗之地。必須在最短時間把數(shù)據(jù)變成信息再變成智慧,數(shù)據(jù)通過網(wǎng)絡是做不到,必須通過光纖。
備份大家都很清楚,現(xiàn)在有越來越多的技術,其中有一個技術data de-duplicantion(重復數(shù)據(jù)刪除),我們做數(shù)據(jù)備份是通過光纖打到磁帶庫,但是有一個很重要的問題,備份有很多時候數(shù)據(jù)是重復的,可能有10GB要備份,現(xiàn)在在備份之前要把重復的數(shù)據(jù)單一化,這樣做備份的時候從10GB變成1GB。
依此類推我有數(shù)據(jù)從北京復制到上海,從北京復制到美國,有沒有辦法做一個簡單的技術,把一些重復的技術,先單一化刪除再做傳輸,這樣從速度、成本、寬帶、很多方面有非常好的節(jié)省。
有一個很重要的技術,提到備份就是歸檔,我們常常把備份跟歸檔分開,當你把備份和歸檔一并考慮的時候,帶來的效果是1+1大于3,因為先做歸檔,把80%頻繁數(shù)據(jù)先歸檔到二級存儲,你只剩下20%的數(shù)據(jù)做備份,或者只剩下20%數(shù)據(jù)做交易處理,對你整個的成本和投資降低非常大,所以備份恢復和歸檔要一并考量,雖然大家都知道,但是沒有考慮重視備份目的是為了什么?
備份就是為了恢復,你備份做得很好,你敢不敢保證恢復做得很好,恢復是備份的目的,備份只是一個手段,恢復是業(yè)務的要求。
恢復的要求在信息生命周期管理中非常重要的。各位很清楚,ILM在2003年大家都在談,老百姓都知道什么ILM了,叫信息生命周期管理。這個戰(zhàn)略和思路,從全球到國內(nèi),很多企業(yè)都已經(jīng)接受而且已經(jīng)實施這樣一個思路和解決方案,根據(jù)你數(shù)據(jù)的重要性,業(yè)務的重要性選擇它的恢復時間和恢復手段,這種解決方案和產(chǎn)品已經(jīng)非常到位了。
備份、恢復和歸檔不要說已經(jīng)很清楚了,因為這些最根本的東西還是要做好。
剛才提到ILM,2003年炒得很熱,2005、2006年還是很熱,2007繼續(xù)在談。分級存儲很簡單,但是帶來的效果是IT界非常認可的幾個概念,甚至一個解決方案。
ILM可否拯救地球?因為我選擇不同的硬盤技術,選擇不同的響應時間的硬盤,把一些不重要的數(shù)據(jù)遷移到性能比較慢的硬盤,性能比較慢的硬盤、轉(zhuǎn)速比較慢的硬盤,這樣相對能耗比較低,進而可以發(fā)現(xiàn)ILM在降低能耗,幫助拯救地球有很多的功能,所以ILM并不簡單解決IT,提升信息價值,降低成本,其實在能源環(huán)保上面還是有它的功效,大家可能沒考慮但的確有它的效果。
這兩條線就是從北京拉到上海,從北京拉到美國,這條線技術基本到位,很久已經(jīng)有了,現(xiàn)在要求三點互為備份,這個技術非常多了。
這就是信息基礎架構,這個架構十年前就是這樣子,五年前也是這個樣子,今天還是這個樣子,只是很多技術都到位了,它根據(jù)你成本的要求,根據(jù)你應用要求,根據(jù)數(shù)據(jù)的重要性,信息生命周期管理的樣子。你可以花1塊錢投資,也可能像美國政府花540億美金投資。
這樣架構是系統(tǒng)七個層面其中兩層,它跟操作系統(tǒng)、數(shù)據(jù)庫、應用等沒關系的,這樣的架構有最高的平滑度,不用擔心上面運行什么平臺,因為這個架構都可以支持。
在這樣的架構里存儲扮演什么角色,從EMC的角度來講,這非常重要,從簡單的數(shù)據(jù)保護,因為數(shù)據(jù)保護能夠讓應用在恢復和重新啟動應用時候做無縫的連接,讓應用可以重新運行。更重要的概念是我有很多在存儲上面一致性的技術,這些技術非常多,可以保證我的應用跟存儲的數(shù)據(jù)可以無縫的結合。
這樣的架構幫助應用運行,進一步提升能源部署,保證業(yè)務的連續(xù)性,很多自動化技術在流程恢復上更加快速,這種架構就是常提到業(yè)務的連續(xù)性,考慮數(shù)據(jù)的保護,考慮數(shù)據(jù)的回復,跟考慮業(yè)務流程的恢復。如果對EMC有興趣,EMC很多存儲產(chǎn)品。
EMC提供這么多的產(chǎn)品和硬件環(huán)境,探討三點,大家都在探討虛擬化,有SAN虛擬化、有文件虛擬化,大家都說基于SAN虛擬化做好夠不夠?不夠,還要針對NAS,還要針對服務器做虛擬化。
一個大型的信息中心一年能耗消耗大概2萬千瓦,根據(jù)高盛分析有70%是服務器。服務器越來越多,刀片式服務器越來越多,EMC有一個產(chǎn)品可以把所有基于I/O架構服務器虛擬化,能夠做到30:1,有3千套服務器,能夠把3千套變成1百套,把3千個硬盒子變成1百個,從能耗管理、空間成本的角度看做的非常顯著,而且非常必要,對國家是非常有效果。
高盛講一個概念很重要,如果每個大的信息中心每年消耗2萬千瓦,全美國友商千個,上萬個這樣信息中心,每年消耗的能源占美國的GDP?大家不要忘了我們家的水龍頭在滴水個人感覺不出來,但是對于社區(qū)和自來水公司影響巨大的,所以能耗必須要考慮。
提供全面式信息架構,不是很多IT的先進技術,先進的技術還是會在開發(fā),先進的解決方案會出來,今天探討的是從國家的戰(zhàn)略,能耗的戰(zhàn)略,管理的戰(zhàn)略和成本戰(zhàn)略要做思考。
現(xiàn)在這么復雜的IT架構怎么管理,EMC資源管理的技術很先進,80年代有一個重要的計劃叫衛(wèi)星收集的計劃,這計劃請三個MIT帶領100個工程人員設計一個管理平臺,怎么管理全球80多顆衛(wèi)星,這計劃失敗了,我們把這100個開發(fā)人員納進來,我們推出一個資源管理的平臺,這資源管理衛(wèi)星。
前一陣子地震把海底光纜震碎了,我可以派船和專人修理,計算中心光纜、網(wǎng)絡斷了可以下去修,馬路可以挖。但是太空上面的衛(wèi)星有沒有辦法動不動就飛到太空去修理,不可能的。
EMC資源管理的設計思路是一個先進的思路,能夠管理你沒有辦法到達的環(huán)境來管理,資源管理是智能化的管理,能夠管理存儲平臺、操作系統(tǒng)、服務器、應用、軟件等等。在信息架構里面智慧型資源管理非常重要的。
另外很重要的是信息安全,各位都提到信息安全跟保護,EMC提一個概念,以前考慮防病毒、防火墻,這些都是防外賊,有沒有辦法防家賊。再怎么防外面很容易防,防家賊很難防的,EMC信息安全戰(zhàn)略,除了提供防外面還提供防內(nèi)部,當小偷跑到家以后,有沒有辦法保護數(shù)據(jù)和信息。
現(xiàn)在所采購各種安全軟件都是在保護你的平臺,比如掃描病毒軟件是保護你筆記本,防火墻是防外,有沒有一個防你的業(yè)務和防公司的應用,實際上沒有。
EMC會在信息安全方面加大力度提供更多的信息安全機制來做保護,我們有一個產(chǎn)品非常簡單,各位看過湯姆克魯斯的《不可能的任務》看完一個錄像會自動5秒銷毀,我們今天已經(jīng)有這樣一個產(chǎn)品,我們這個產(chǎn)品可以在文檔、文件,可能一個PPT,我們加密,你看完以后這PPT可以設定5分鐘5秒就看不到了,這些產(chǎn)品EMC都有。
所以信息安全不是我們討論傳統(tǒng)的保護筆記本,保護你的產(chǎn)品,而是保護你的業(yè)務。這是我們討論故宮的概念,故宮真正打進去是李自成,但是根據(jù)統(tǒng)計有15個皇帝,差一點被貝勒爺、宮女刺殺。
所以EMC相信所謂信息基礎架構不是以應用和平臺為核心,而是以信息為核心。因為可以反映客戶的是你的數(shù)據(jù)和信息,不是那臺服務器,也不是TCP/IP,也不是數(shù)據(jù)庫,是以信息為核心的架構。
這樣的架構從客戶到企業(yè)的優(yōu)勢,到流程、應用、架構,在基礎架構投資1塊錢,對客戶可能帶來上千倍、上萬倍的回收。如果信息基礎架構做得不好,想通過業(yè)務流程要花1百倍甚至更多的精力。
各位都看到電影《指環(huán)王》,上面講過很多事情你不希望它發(fā)生,但是你唯一能做的就是在有限時間內(nèi)把該做的事情做完,這就是我今天的匯報,謝謝!