趙建凱 發(fā)表于:13年08月07日 14:29 [轉載] IT經理世界
他是某世界500強公司亞太區(qū)的CIO,“Wilson”是他按照公司要求每個員工都應該有一個英文名而給自己起的。作為一個土生土長的北京人,他從小叫起來的名字是“慕容”。之所以如此取名,是因為父母都很喜歡席慕容的詩。但在給別人解釋時,他更愿意把自己名字的來源說成是武俠小說里那位武功出神入化、博取百家之長的姑蘇慕容公子。特別是現在,他腦子里可想不起來席慕容的什么美妙詩篇,只恨不得馬上就神功在身,立刻解決掉眼下的煩惱心頭事。
財年剛過,公司的CFO就告訴他,由于整體經濟形勢仍處于不景氣階段,公司決定減少在數據中心上的投入預算,大概縮減了去年投入的20%左右,要他拿出具體的縮減方案來。CFO剛走,CTO就又找上了門兒。因為今年公司要開發(fā)幾個大型的應用程序,CTO要求公司多添置一些高性能的新服務器。一個是要省錢,一個是要花錢,這一“加”一“減”出來的“虧空”,都要靠他這個公司的CIO來“填補”上。除此之外,公司占地2000多平米的數據中心今年也迎來了第十個年頭,超出Wilson當初預想的兩年。“需求在增加,數據中心又到了極限,經濟不景氣的原因又讓新建和升級數據中心的事兒往后推遲——這些都讓人很頭疼。”Wilson說。據Gartner的一項長期跟蹤研究,現在許多大企業(yè)都在想方設法避免由于升級、擴建或搬遷為數據中心帶來的成本。“大型數據中心方面的投入就算不耗資上億美元,至少也要耗資上千萬美元。由于數據中心通常每過5到10年就更新一次,所以這需要大筆資金,于是許多公司都在另辟蹊徑。”Gartner研究副總裁如是說。
解決能耗問題
縱然是煩惱在心,但Wilson在答復CFO和CTO時,都是一副禮貌性的笑臉,并信心滿滿地說:“I’m Wilson,and Will be soon.(相信我,很快就能處理好!)”
雖然口頭上說得如此輕松,但Winson在下面急忙做起了功課。他發(fā)現,公司整個數據中心的運營成本中,電力消耗就占到了35%~45%,這著實讓他吃了一驚。據施耐德電氣的研究數據,大部分傳統(tǒng)數據中心用電的 47% 都消耗在 IT 負載上,而其余的電力則都被制冷及照明等設備所消耗。換句話說,有53% 電力是被“浪費”的。
業(yè)界中用PUE值來衡量數據中心里電力的使用效率,PUE=總能耗/有效利用能耗。“理論上說,設計合理的數據中心的PUE值應該在1.2到1.4之間。”施耐德電氣執(zhí)行副總裁,APC總裁兼首席執(zhí)行官Laurent Vernerey說。而Wilson經過計算后發(fā)現自己公司數據中心的PUE值是2.13。
由此看來,要想縮減預算投入,就必須降低PUE的值,而第一任務便是提高數據中心的能效問題。“想要進一步提高數據中心的能效,首要的步驟是要對能效進行衡量。”施耐德電氣執(zhí)行副總裁,APC總裁兼首席執(zhí)行官Laurent Vernerey如是說。Wilson經過仔細“盤查”后發(fā)現,制冷系統(tǒng)是數據中心里與服務器一樣的另一只“電老虎”,耗電量甚至超過了服務器自身的能耗。
Wilson到那2000多平米的數據中心里用了幾乎一上午的時間閑庭漫步式的走了一圈,發(fā)現一些地方放置的設備往往過多,導致局部熱點的出現,從而嚴重消耗了電力和冷卻資源。于是他就讓人簡單調整了一下機柜的位置,采用背對背式排列,確保機柜背面的氣流非常暢通,并讓設備得到適當冷卻。他還讓冷風從機柜底部的前邊進入,從數據機柜后側排出。這種方式與上送風形式相比,讓空調風機耗電量節(jié)省了30%。“只是簡單的挪了個位置,調整了下進風風向,就讓我們毫不費力的省卻了購置更大功率空調系統(tǒng)和更多電力的成本。”Wilson說。
從業(yè)務應用上入手
按照Wilson最初的想法,想靠極力降低PUE的值來縮減數據中心的運營成本,但他后來翻遍幾乎所有其他大型跨國公司新建和擴建數據中心案例后發(fā)現,獲得較低的PUE值往往都會帶來額外的成本投入。Wilson心里也明白,省電只是“小把戲”,不足以應付CFO,更與CTO的需求沾不上邊兒,關鍵的解決辦法還是要從業(yè)務應用上入手,從數據中心里挖掘出新的商業(yè)價值來——而這勢在必行,因為那一個要省錢一個要花錢的兩位“大佬”都在不同場合上有意無意的問過他:“Wilson,be will soon?(快處理好了嗎?)”
從業(yè)務上入手,那就要看數據中心之于公司業(yè)務的角色是什么。在以往,業(yè)界內通常是按照規(guī)模來對數據中心加以分類,即:大、中、小。而在施耐德通過與成千上萬不同行業(yè)的企業(yè)用戶合作與接觸后,按照使用需求來分類:第一類是把數據中心當成工具來使用;第二類是把數據中心當成一種投入;第三類是把數據中心當成自己核心的業(yè)務。
把數據中心當作自己的核心業(yè)務來運營的企業(yè),比如Google、Amazon這樣的,會更在意數據中心前期的投入和實際的運營成本,同時會要求最終的整體投入更加高效。若把數據中心當成一種固定投入,比如銀行、證交所等企業(yè),他們會進一步要求數據中心有更高的可用性和可靠性。對于一些中小企業(yè)而言,他們只是把數據中心當作一種工具,只是要求有很好的可用性就可以了。
Wilson思付再三,決定要讓自己的數據中心在支持業(yè)務的可用性和可靠性上發(fā)揮出更多的價值,這既讓CFO滿意,有讓CTO滿意。
在應用上,最先引起Wilson注意的就是處理數據的成本。比如說,公司每周都會有定期的培訓和團隊建設的活動,參加活動的人會使用公司的服務器、存儲系統(tǒng)和帶寬資源,來編輯、共享和長時間保留這些圖片和視頻。為了讓數據中心從這些非關鍵性數據的處理中解放出來,Wilson在照片共享網站和視頻分享網站上各開設了一個企業(yè)帳戶,把管理那些照片、視頻方面的所有流程都轉移到了外面的網站上面。這樣一來,不但省掉了幾萬美元的存儲設備的購買,還減輕了與高分辨率照片、大容量視頻有關的資源密集型活動給數據中心所帶來的壓力,數據中心再也不必提供用于傳送視頻的專用帶寬和用于保留視頻的專用硬件了。“把非關鍵的、非核心的數據遷移到數據中心外面之后,就可以將存儲空間專門用于關鍵任務型項目。”Wilson說。而此舉更為CFO所要的縮減方案上,添上了濃重的一筆。
同其他企業(yè)的CIO一樣,Wilson也想到了在數據中心里采用虛擬化技術。經過測算,Wilson發(fā)現公司的全部物理設備支持將近1000個虛擬服務器,這樣就可以騰出更多的場地,節(jié)省更多的電力和資源。雖然虛擬化技術需要高性能、高密度的服務器,但是Wilson將這批機器整合成幾百臺節(jié)能的物理機器,又進一步降低了數據中心的總能耗,讓PUE值也進一步下降。
Wilson還清理了數據中心里“閑置”的服務器,在這些服務器上,僅僅運行著一兩個應用程序,利用率及其低下,但耗電量卻不低,“經過測量,我們發(fā)現服務器開著時所消耗的能量相當于它在滿負荷運行時候的50%至60%。”Wilson說。而且,舊服務器的效率往往比用于如今虛擬化項目的服務器低得多。從應用上入手,除了讓公司數據中心的PUE值越來越低外,為CFO省的錢比挪動個機柜要多的多了。
下面要做的就是滿足CTO的需求了。Wilson仔細想了想,其實CTO所需要的其實并不是多花錢,而是需要更高的計算能力及更多的計算資源。
Wilson調查了下公司開發(fā)和測試人員的計算資源使用率,結果發(fā)現給他們提供多少資源,這些測試和開發(fā)人員就會耗用多少。而且,還發(fā)現一些被拋棄或已結束的測試和開發(fā)項目仍然在占用著資源。在有的時候,短時間內集中的測試和開發(fā)甚至能拖垮整個數據中心的運行。
Wilson清理出來被閑置占用的資源后,專門在數據中心里開辟出了一個區(qū)域給CTO,并配備了符合開發(fā)和測試要求的、專門的服務器和存儲資源。并叮囑CTO,這塊領地只是暫時劃歸給他,一旦開發(fā)項目結束后,便會立即收回資源。并也在有意無意間提醒CTO要確保開發(fā)人員使用最嚴謹的代碼,那樣開發(fā)出來的應用程序才最高效。“這既合理調配了數據中心的計算資源,不必再去另外購置,又滿足了開發(fā)和測試要求,并在一定程度上保證了開發(fā)效率,不啻為一個創(chuàng)新的好方法。”Wilson說。
表面上來看,Wilson所做的這些都是在電力、空間、計算等資源方面的節(jié)省和改進。但從業(yè)務角度來看,Wilson所做的這些節(jié)省和改進,其效果則是對公司整個業(yè)務的支撐。公司業(yè)務的發(fā)展已經越來越離不開數據,而一個可以提供更高可靠性、可用性、安全性的數據中心,為企業(yè)帶來價值是遠遠超過能源的節(jié)省的。Wilson在數據中心里挖掘出來了更多的商業(yè)價值。