會上,浪潮信息重磅發(fā)布元腦?服務器第八代算力平臺,基于開放架構(gòu)設計,業(yè)界率先實現(xiàn)“一機多芯”,同一架構(gòu)支持英特爾?至強?6處理器及AMD EPYC? 9005系列處理器,在促進多元生態(tài)共進的同時,具備更全面的智能能力和更高能效,更好支撐AI大模型開發(fā)與應用創(chuàng)新。實測數(shù)據(jù)表明,在LLaMA2大模型AI推理場景中,整機性能較上代最大提升3倍。
與此同時紫光股份旗下新華三集團“乘勢·進化·臻于智境”智算新品發(fā)布會也如火如荼的舉行
本次大會匯聚業(yè)界權(quán)威研究機構(gòu)、智算產(chǎn)業(yè)鏈上下游合作伙伴、重點行業(yè)客戶等產(chǎn)學研用領域相關專家代表,共同見證新華三多元異構(gòu)算力平臺——H3C UniServer G7系列、下一代AI數(shù)據(jù)存儲平臺——H3C UniStor Polaris X20000系列、傲飛算力平臺等十余款智算新品的發(fā)布,以持續(xù)進化的算力產(chǎn)品,助力行業(yè)客戶加速邁向智能化未來,共同推動AI產(chǎn)業(yè)繁榮發(fā)展。
01
元腦?服務器第八代算力平臺
一機多芯,開放標準促進多元算力生態(tài)進化
隨著大模型能力的持續(xù)提升,生成式人工智能在企業(yè)側(cè)、行業(yè)側(cè)的落地正在提速,智能應用不斷涌現(xiàn)。
日趨豐富的AI應用場景也衍生出新的算力挑戰(zhàn),不同AI應用的典型特征及系統(tǒng)需求存在差異,需要多元的算力生態(tài)予以滿足。伴隨著通用處理器在芯片架構(gòu)、指令集等方面對AI的優(yōu)化增強,在AI推理端的巨大應用潛力使得CPU在AI時代變得更加重要,需要系統(tǒng)創(chuàng)新釋放通用算力在AI領域的應用價值。
元腦服務器第八代算力平臺成為全面且強大算力生態(tài)的載體,源于浪潮信息的諸多創(chuàng)新系統(tǒng)架構(gòu)設計,將通過共建開放標準的方式聚集更多生態(tài)力量,使能通用算力與AI算力共同支撐日益多樣的AI工作負載,加速多元算力生態(tài)進化,推動開放多元算力標準落地。
通用算力領域
浪潮信息積極參與的開放計算模組規(guī)范(OCM),正在推動建立基于處理器的標準化算力模組單元,構(gòu)建CPU的統(tǒng)一算力底座,解決多元CPU生態(tài)挑戰(zhàn)問題,推動算力產(chǎn)業(yè)快速發(fā)展。會上發(fā)布首款基于服務器計算模組設計規(guī)范OCM的NF3290G8,整機全面解耦,以CPU、內(nèi)存為核心構(gòu)建最小算力單元,標準化高速/低速互聯(lián)接口,實現(xiàn)處理器算力模組部件化,靈活支持多類型CPU,讓不同算力共享統(tǒng)一平臺,降低算力產(chǎn)業(yè)創(chuàng)新試錯成本和推廣適配成本,也讓多元化的應用場景能夠快速找到貼合的方案。
AI算力領域
浪潮信息推動開放加速規(guī)范OAM的生態(tài)繁榮,大幅縮減國內(nèi)外加速芯片和服務器的適配周期,加速先進算力上線部署,支撐大模型及AI應用迭代成熟。目前,90%高端AI芯片基于OAM規(guī)范設計。會上發(fā)布基于UBB2.0規(guī)范開發(fā)的元腦服務器NF5898G8,可以兼容符合OCP開放加速規(guī)范的多款OAM 2.0模組,通過全模塊化的設計及極致的系統(tǒng)能效,滿足算力的快速迭代需求,進一步加速算力融合創(chuàng)新。
智能增強,全面加速大模型開發(fā)與AI應用創(chuàng)新
元腦服務器第八代算力平臺實現(xiàn)了全面的智能增強,通過搭載自研服務器操作系統(tǒng)KOS、AIOps智能運維管理平臺以及AI軟件堆棧,從服務器智能,到快速構(gòu)建AI開發(fā)環(huán)境,到作業(yè)調(diào)度和資源統(tǒng)一納管,乃至智算中心智能運維,提供全面的平臺軟件與工具軟件支持。
新平臺在預警、散熱、管理等方面進行了全新的智能化升級。其中,在智能預警方面,全新升級內(nèi)存故障智能預警修復技術(shù)MUPR,基于對上萬臺服務器故障數(shù)據(jù)的建模分析和AI模型算法的訓練,實現(xiàn)內(nèi)存故障提前預警、內(nèi)存錯誤實時隔離、內(nèi)存故障智能修復,降低內(nèi)存導致宕機故障率80%。在智能管理方面,通過RTOS實時操作系統(tǒng),實現(xiàn)開機3秒內(nèi)智能管理調(diào)控風扇轉(zhuǎn)速,降低30%的噪音,確保散熱安全。
面向大模型部署難題,新平臺與服務器操作系統(tǒng)KOS實現(xiàn)軟硬協(xié)同優(yōu)化,自研KOS AI定制版簡單2步即可實現(xiàn)大模型訓練環(huán)境搭建,200節(jié)點訓練集群開發(fā)環(huán)境,采用AI定制版20分鐘即可完成部署上線可用,極大提升了大模型開發(fā)部署效率。
技術(shù)優(yōu)勢與應用場景
1
性能與能效提升
相比第三代至強處理器,搭載最新英特爾?至強?6處理器的元腦服務器性能提升200%,每單位能耗下性能提升230%以上。這種性能提升不僅體現(xiàn)在處理速度上,還體現(xiàn)在能效比上,為AI、云原生、數(shù)據(jù)分析等多樣化應用場景提供更綠色、更強大的算力支持。
2
廣泛的適用性
元腦?服務器第八代新品適用于多種應用場景,包括AI訓練、AI推理、通用AI、云計算/虛擬化、大數(shù)據(jù)、分布式存儲、視頻轉(zhuǎn)碼、數(shù)據(jù)處理等。其豐富的產(chǎn)品線和靈活的配置選項能夠滿足不同行業(yè)和領域的需求。
02
新華三重磅發(fā)布多款智算新品
新華三集團總裁于英濤發(fā)表致辭
在AIGC時代,新華三希望帶來全新的想法、產(chǎn)品與解決方案:一是聚焦“算力×聯(lián)接”,充分發(fā)揮自身在算力和聯(lián)接領域,特別是在片間互聯(lián)和集群互聯(lián)等方面的核心優(yōu)勢,激發(fā)乘數(shù)效應,最大限度釋放智算資源價值,讓算力更澎湃;二是深化“AI in ALL”,持續(xù)強化全系列產(chǎn)品的智原生能力,實現(xiàn)全棧軟硬件產(chǎn)品、解決方案內(nèi)嵌AI,打造更便捷高效的客戶交互體驗,讓算力更智能。此外,我們也將秉持開放協(xié)同理念,聯(lián)合各地政府及眾多生態(tài)伙伴,依托圖靈小鎮(zhèn)模式成功經(jīng)驗,切實提高智算中心使用效益,滿足不同行業(yè)、不同規(guī)模客戶多元的算力需求,助力算力普惠。 ——于英濤紫光股份董事長、新華三集團總裁兼CEO
多元異構(gòu)算力平臺 H3C UniServer G7系列
面向AI的可進化架構(gòu)
H3C UniServer G7系列服務器采用先進的模塊化設計,CPU/GPU/存儲等子系統(tǒng)均可隨需升級;智流風道、智冷散熱、智靜網(wǎng)棉、智旋風扇、智敏傳感等高效系統(tǒng)設計,完美應對高功耗挑戰(zhàn)。新華三踐行ALL in Green戰(zhàn)略,G7產(chǎn)品家族液冷技術(shù)多維進化,助力可持續(xù)發(fā)展目標;推動智算算力接口標準化,G7新一代AI服務器兼容OAI 2.0標準,已完成和10+家AI芯片廠商的聯(lián)合設計,共同打造開放生態(tài);業(yè)界首款E3.S CXL2.0內(nèi)存池,降低成本的同時提升數(shù)據(jù)交換性能,重塑數(shù)據(jù)中心架構(gòu)。
內(nèi)生AI的操作系統(tǒng)和管理中樞
新華三自研數(shù)據(jù)中心操作系統(tǒng)磐寧OS具有高可靠、強性能、易維護的優(yōu)勢,滿足云計算、數(shù)據(jù)庫、大數(shù)據(jù)、人工智能等業(yè)務要求,已廣泛應用于金融、政企、運營商等行業(yè);智能管理中樞五大智能再次升級,有效提升運行效率、性能和診斷準確率的同時,大幅降低能耗。
擁抱AGI的多元算力體系
H3C UniServer R4900 G7是業(yè)界唯一支持6張雙寬GPU的2U服務器,樹立通用服務器新標準,實現(xiàn)對虛擬化、SDS、云計算等場景的全面賦能;AI算力旗艦 H3C UniServer R5500 G7支持萬億參數(shù)大模型訓練,已覆蓋超過15種主流開源大模型的訓練;AI訓推一體引擎 H3C UniServer R5300 G7可同時搭載8塊雙寬GPU或16塊單寬GPU,擁有廣泛的模型兼容性,兼容超過200個主流AI模型;面向萬億模型超節(jié)點集群——UniPoD 是目前業(yè)界唯一使用PCIe方案的AI超節(jié)點,產(chǎn)品實現(xiàn)Scale-up互聯(lián)規(guī)模顯著提升,大幅降低延遲,有效提升萬億參數(shù)模型訓練性能。
H3C UniStor Polaris X20000系列
●性能加速:Polaris X20000系列通過存儲軟件棧全面重構(gòu)大幅精簡無效IO并優(yōu)化IO路徑,實現(xiàn)單節(jié)點80GB/s帶寬、200萬IOPS優(yōu)異性能,大規(guī)模集群性能近線性增長,滿足智算應用海量小文件高性能并發(fā)和百TB級帶寬需求。
● 架構(gòu)簡化:Polaris X20000系列面向AI智算多樣性數(shù)據(jù)處理,一個邏輯資源池同時支持文件、對象以及大數(shù)據(jù)應用,跨協(xié)議訪問無需轉(zhuǎn)換數(shù)據(jù)格式,從數(shù)據(jù)采集到模型訓練以及模型分發(fā),在AI大模型訓練全流程中數(shù)據(jù)免搬遷,性能無損,語義無損。
● 極致穩(wěn)定:Polaris X20000把智算存儲平臺的可靠性從“數(shù)據(jù)級可靠”提升至“服務級可靠”。Polaris X20000采用全分布式多活架構(gòu),在意外故障的情況下,實現(xiàn)故障秒級切換,計劃內(nèi)擴容與升級時,上層業(yè)務無感;支持多租戶共享同一存儲池,且租戶間安全隔離,互不影響,保障智算訓練任務不間斷連續(xù)運營。
傲飛算力平臺
AI技術(shù)的演進和大模型的興起帶來算力需求呈指數(shù)級增長,超大規(guī)模算力、超大規(guī)模存儲、超大規(guī)模組網(wǎng)對算力設施建設和超大規(guī)模算力調(diào)度提出了新的挑戰(zhàn)。新華三集團云與計算存儲產(chǎn)品線、云與大數(shù)據(jù)產(chǎn)品線首席產(chǎn)品經(jīng)理王鋒表示,面向AGI時代,高效的算力調(diào)度對提升算力資源利用率尤為重要。為應對更加復雜的計算需求,新華三持續(xù)進化傲飛算力平臺,充分融合十年云原生積累,全面提升有效性、可靠性、穩(wěn)定性及易用性,以高性能算力基礎設施為依托,助力行業(yè)客戶像用電一樣,更普惠、更便捷的使用算力,加速AGI落地。
結(jié)語
元腦?服務器第八代新品以及新華三發(fā)布十余款智算新品并建立多元異構(gòu)算力平臺,都是當前智能計算領域的重要進展。這些舉措不僅提升了服務器的性能和能效比,還豐富了市場選擇,推動了智能計算技術(shù)的發(fā)展和應用。 (文/宋雨涵)