亞馬遜云科技大中華區(qū)企業(yè)級(jí)業(yè)務(wù)及行業(yè)市場(chǎng)拓展部總經(jīng)理凌琦

以極致算力服務(wù),推動(dòng)HPC民主化

HPC的應(yīng)用早期主要集中在科研領(lǐng)域,為什么現(xiàn)在開始大規(guī)模地在泛商業(yè)領(lǐng)域落地?

對(duì)此,凌琦分析指出,泛商業(yè)領(lǐng)域很早就對(duì)HPC有所期待,但一直面臨計(jì)算資源有限、預(yù)算不足、計(jì)算時(shí)間長(zhǎng)、缺乏商業(yè)軟件等諸多挑戰(zhàn),隨著大數(shù)據(jù)與人工智能的普及,情況變得更加嚴(yán)重。當(dāng)云計(jì)算與HPC相結(jié)合以后,帶來了高性能、高彈性與低成本等優(yōu)勢(shì),才克服了這些挑戰(zhàn),推動(dòng)了HPC在泛商業(yè)領(lǐng)域逐漸得到廣泛的應(yīng)用。

HPC云平臺(tái)固然有高彈性的優(yōu)勢(shì),但是其基于虛擬化管理是有成本的,與物理的HPC環(huán)境相比,HPC云平臺(tái)是否在性能上要有所犧牲?

凌琦介紹,為了讓客戶得到100%的算力,亞馬遜云科技在在體系架構(gòu)上進(jìn)行了創(chuàng)新,通過專有芯片對(duì)虛擬化進(jìn)行管理,從而把計(jì)算百分之百地提供給客戶。

由于HPC的用戶主要是各領(lǐng)域的專業(yè)人員,亞馬遜云科技一直致力于通過引入基于ARM 架構(gòu)芯片、HPC集群管理、數(shù)據(jù)安全與合規(guī)等科技創(chuàng)新,把算力、存儲(chǔ)、網(wǎng)絡(luò)、服務(wù)等做到極致,為專業(yè)人員解決IT方面的后顧之憂。

一家美國(guó)客戶原來在美國(guó)超算中心進(jìn)行氣象計(jì)算,后來遷移到亞馬遜云上,性能大幅提升了53%,這要涉及到特別的算法、亞微秒級(jí)延時(shí)的網(wǎng)絡(luò)、高吞吐工作負(fù)載、容器化調(diào)度等各種服務(wù)。

F1一級(jí)方程式大賽是全球最昂貴、科技成本最高的體育賽事之一。在車輛設(shè)計(jì)、比賽場(chǎng)館監(jiān)控,特別是CFD 空氣動(dòng)力學(xué)模擬等方面需要大量的算力支持。在亞馬遜云科技的幫助下,云平臺(tái)上的兩個(gè)汽車湍流模擬從1增加到5,仿真時(shí)間從60小時(shí)降低到18小時(shí),算力規(guī)??梢詮?92 核擴(kuò)展到1440 核 (C5n with EFA + Amazon ParallelCluster) ,F(xiàn)1官方評(píng)價(jià)與亞馬遜云科技合作的項(xiàng)目是F1空氣動(dòng)力學(xué)應(yīng)用歷史上最具創(chuàng)新意義的項(xiàng)目。

2019年底,亞馬遜云科技對(duì)全球1500個(gè)云上客戶的整體應(yīng)用成本、運(yùn)維效率、產(chǎn)品上市時(shí)間等多維度進(jìn)行全面分析后得出的結(jié)論為:整體上云后的成本降低27%,管理效率提升50%,同時(shí)因?yàn)楹芏嘣粕蠎?yīng)用可以自動(dòng)化,使得客戶可以輕松地在云上一鍵部署,快速擴(kuò)張,快速關(guān)停,整體業(yè)務(wù)的 TTM 時(shí)間提升了37%。

在第三方調(diào)查中,HPC 連線雜志每年對(duì)全球用戶進(jìn)行調(diào)研,亞馬遜云科技也連續(xù)3年被評(píng)為最佳高性能云計(jì)算平臺(tái)。尤其值得一提的是,目前在全球高性能計(jì)算轉(zhuǎn)向云平臺(tái)的過程中,58%的HPC計(jì)算量處于亞馬遜云上。

正是由于亞馬遜云科技在云科技領(lǐng)域持續(xù)進(jìn)行的前瞻性研究和投入,保證了其始終走在行業(yè)的前沿。

芯片創(chuàng)新:亞馬遜云科技基于 Arm 的架構(gòu)設(shè)計(jì)出 Amazon Graviton2 處理器,并將其算力通過云的形式對(duì)外提供服務(wù)。相對(duì)于傳統(tǒng)計(jì)算架構(gòu),Amazon Graviton2 能帶來最高40%性價(jià)比提升,能在更經(jīng)濟(jì)的情況下完成高性能計(jì)算任務(wù)。

2021 CCF 全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)上,亞馬遜云科技榮獲2021年度自主研發(fā)的 Graviton2 芯片及相關(guān)計(jì)算實(shí)例產(chǎn)品創(chuàng)新大獎(jiǎng)。

豐富實(shí)例:由于高性能計(jì)算的種類眾多,負(fù)載各異,對(duì)基礎(chǔ)架構(gòu)的要求也不一樣,亞馬遜云科技圍繞高性能計(jì)算設(shè)計(jì)開發(fā)了很多種專業(yè)服務(wù),僅算力就有超過400種實(shí)例可供用戶靈活選擇。

量子計(jì)算:量子計(jì)算是下一代計(jì)算能力的一個(gè)重要突破點(diǎn),而量子計(jì)算服務(wù)在亞馬遜云科技并非只停留在實(shí)驗(yàn)室,而是已經(jīng)把三家技術(shù)路線不盡相同的量子計(jì)算硬件服務(wù)商的解決方案云化后,為用戶提供按需購買的量子計(jì)算服務(wù),并已應(yīng)用于金融、制藥等多個(gè)行業(yè)。

公開數(shù)據(jù)集:當(dāng)今的高性能計(jì)算很大程度上與大數(shù)據(jù)或人工智能仿真相關(guān),由此帶來大量數(shù)據(jù)應(yīng)用。除了客戶自己的數(shù)據(jù)外,在建立模型以及對(duì)模型進(jìn)行測(cè)試也會(huì)需要處理大量的公開的數(shù)據(jù)集或第三方的數(shù)據(jù)集。亞馬遜云科技目前已經(jīng)在全球提供了包括對(duì)于地球物理環(huán)境的監(jiān)控?cái)?shù)據(jù)、對(duì)海洋表面溫度的數(shù)據(jù)和人類的基因數(shù)據(jù)等300多個(gè)公開數(shù)據(jù)集。

由于中國(guó)的市場(chǎng)和用戶與國(guó)際有所不同,亞馬遜云科技是否有專門針對(duì)中國(guó)用戶的創(chuàng)新?

凌琦指出,中國(guó)正在經(jīng)歷大規(guī)模全面的數(shù)字化轉(zhuǎn)型,在工業(yè)4.0、移動(dòng)支付等各個(gè)領(lǐng)域有著非常豐富的應(yīng)用場(chǎng)景和國(guó)外所沒有的規(guī)模,并且在一些領(lǐng)域通過更多的投資已經(jīng)走在了前列,未來將會(huì)有很多精彩的創(chuàng)新在中國(guó)率先出現(xiàn)。亞馬遜云科技是一家長(zhǎng)期堅(jiān)持以客戶需求為中心的公司,致力于深入了解客戶應(yīng)用的痛點(diǎn),也會(huì)與積極與中國(guó)客戶一起進(jìn)行創(chuàng)新。

以金風(fēng)慧能為例,風(fēng)電的產(chǎn)生、風(fēng)電廠的管理等與天氣預(yù)測(cè)的關(guān)系非常密切。據(jù)介紹,WRF全流程-Weather Research and Forecasting Model是金風(fēng)慧能在功率預(yù)測(cè)產(chǎn)品氣象數(shù)值模式計(jì)算的主要工作負(fù)載,但面臨著計(jì)算資源短缺的巨大挑戰(zhàn)亟需補(bǔ)充。

經(jīng)過多家單位的計(jì)算資源測(cè)試,并完成了x86和ARM架構(gòu)下數(shù)值模式的運(yùn)算實(shí)驗(yàn),金風(fēng)慧能最終選定亞馬遜云科技ARM架構(gòu)機(jī)型,每年節(jié)省了70%的成本,相同數(shù)據(jù)集的計(jì)算時(shí)間縮短了30%,C6g.4xlarge 實(shí)例16個(gè)vCPU性能達(dá)到了之前物理數(shù)據(jù)中心28核服務(wù)器的性能,在亞馬遜云科技云平臺(tái)上實(shí)現(xiàn)了WRF全流程交付,也極大地簡(jiǎn)化了金風(fēng)慧能的運(yùn)維工作。

GeoSoftware通過整合亞馬遜云科技的高性能計(jì)算能力,可以讓地球科學(xué)家在幾分鐘內(nèi)擴(kuò)展出數(shù)千數(shù)萬個(gè)CPU來應(yīng)對(duì)作業(yè)隊(duì)列的處理工作,將復(fù)雜運(yùn)算結(jié)果的取得時(shí)間從傳統(tǒng)方式的1周縮短至3~4小時(shí)。而且NICE DCV將用戶界面流式傳輸?shù)娇蛻舳擞?jì)算機(jī),無需再依賴昂貴的專用工作站,為用戶提供了更加便利的體驗(yàn)。

目前,亞馬遜云科技已經(jīng)廣泛服務(wù)于能源、汽車、醫(yī)藥等各行各業(yè)的HPC客戶。

積極采用可再生能源,持續(xù)提升云能效

中國(guó)基于推動(dòng)構(gòu)建人類命運(yùn)共同體的責(zé)任與擔(dān)當(dāng),以及實(shí)現(xiàn)可持續(xù)發(fā)展的內(nèi)在要求,向世界作出莊嚴(yán)承諾,出臺(tái)了“碳達(dá)峰與碳中和”的重大戰(zhàn)略決策。

亞馬遜云科技也提出了助力“雙碳”目標(biāo)實(shí)現(xiàn)的戰(zhàn)略與舉措。

在可再生能源方面,亞馬遜承諾,2025年亞馬遜的基礎(chǔ)設(shè)施100%使用可再生能源,覆蓋亞馬遜的辦公室、交付中心和亞馬遜云科技的數(shù)據(jù)中心。

今年9月,亞馬遜宣布了在中國(guó)支持的第二個(gè)可再生能源項(xiàng)目——位于吉林省的100兆瓦(MW)風(fēng)能項(xiàng)目。該項(xiàng)目將于 2023年投入運(yùn)營(yíng),預(yù)計(jì)屆時(shí)每年可提供超過30萬兆瓦時(shí)(MWh)的可再生能源,相當(dāng)于為超過15萬戶中國(guó)普通家庭提供電力支持。亞馬遜在中國(guó)支持的第一個(gè)可再生能源項(xiàng)目是去年宣布的位于山東的太陽能項(xiàng)目。

亞馬遜作為全球最大的可再生能源企業(yè)采購商之一,已經(jīng)在全球打造了232個(gè)項(xiàng)目,到2025年將實(shí)現(xiàn)全球基礎(chǔ)設(shè)施100%使用可再生能源。

在提高云的能效方面,亞馬遜云科技的基礎(chǔ)設(shè)施比同行能效高。調(diào)查演講結(jié)果顯示,亞馬遜云科技的基礎(chǔ)設(shè)施能源效率,比受訪的其它美國(guó)企業(yè)數(shù)據(jù)中心的中位數(shù)高3.6倍,主要原因是亞馬遜云科技的服務(wù)器更節(jié)能,服務(wù)器利用率更高。此外,因?yàn)閬嗰R遜云科技在設(shè)施的各個(gè)方面都采取了提高能效的措施,其數(shù)據(jù)中心也比企業(yè)的數(shù)據(jù)中心更節(jié)能。

小結(jié)

今天各行各業(yè)的用戶對(duì)高性能計(jì)算需求可以說是已經(jīng)變得無處不在,從以前的傳統(tǒng)高性能計(jì)算,比如地球物理研究、石油勘探、天氣預(yù)測(cè)等領(lǐng)域到近幾年出現(xiàn)的基因測(cè)序、自動(dòng)駕駛都有它的身影。最新一代的人工智能技術(shù),以及大數(shù)據(jù)技術(shù)的發(fā)展,將高性能計(jì)算進(jìn)一步推廣到更多領(lǐng)域。

在計(jì)算量不斷提升的壓力下,為了在更高性價(jià)比的情況下,使計(jì)算能力大幅度地提高,在集群運(yùn)作過程中完成大量的管理工作,越來越多的客戶開始考慮如何能把高性能計(jì)算在云實(shí)現(xiàn)。

亞馬遜云科技在全球三大超算領(lǐng)域盛會(huì)之一的CCF HPC China 2021上,為我們完美地展示了卓越不凡的云上HPC硬實(shí)力。

分享到

xiesc

相關(guān)推薦