上海WAIC 2025期間,中國移動與曙光存儲共同舉行了“算力中心全局統(tǒng)一文件存儲系統(tǒng)”的落地儀式,該平臺是國內(nèi)首個智能存力調(diào)度平臺的正式落地。

這一舉措被業(yè)內(nèi)視為繼“東數(shù)西算”工程啟動以來,存儲領域最具標志性的節(jié)點事件:它首次把“算力網(wǎng)絡”所缺失的“存力中樞”補全,讓數(shù)據(jù)真正像電力一樣,在全國范圍可調(diào)度、可定價、可交易。

平臺之魂:“中樞神經(jīng)”如何運轉(zhuǎn)

“智能存力跨域調(diào)度平臺”被明確定位為“先進存力中心的中樞神經(jīng)”,承擔起全局數(shù)據(jù)統(tǒng)一管理、跨域資源調(diào)度的關鍵角色,如同連接全國存力資源的“智慧大腦”,實現(xiàn)不同區(qū)域、不同廠商存儲系統(tǒng)的協(xié)同運作。其核心是一套橫跨4000千米的全局文件系統(tǒng),具備三大特性:一是資源動態(tài)調(diào)配:通過AI預測模型,把90天未被訪問的數(shù)據(jù)自動下沉到西部冷池,熱數(shù)據(jù)則彈性上浮到距GPU兩跳以內(nèi);二是異構整合:內(nèi)置8類協(xié)議網(wǎng)關,納管不同廠家存儲系統(tǒng),遷移時間從周級縮至小時級;三是跨域無感訪問——芯片級“超級隧道”全面優(yōu)化加速,數(shù)據(jù)傳輸延遲降至毫秒級,用戶體感與本地盤無異。

對企業(yè)而言,該平臺解決了數(shù)據(jù)管理分散、流動低效的問題,降低了AI應用落地成本;對社會而言,其完善了全國一體化算力網(wǎng)絡,加速數(shù)據(jù)要素市場化進程,為“東數(shù)西算”戰(zhàn)略提供堅實支撐。

目前,智能存力調(diào)度平臺已在中國移動的多區(qū)域節(jié)點落地,其技術架構具備通用性。電信、聯(lián)通等運營商同樣存在存力整合需求。

作為“東數(shù)西算”戰(zhàn)略的重要承載平臺,智能存力調(diào)度平臺已率先覆蓋長三角、成渝、內(nèi)蒙古、貴州四大國家級樞紐節(jié)點,覆蓋橫跨東西、聯(lián)動南北的七大存力資源池。全套方案自主可控,兼容全球8種AI芯片,對穩(wěn)定推動國家數(shù)字經(jīng)濟高質(zhì)量發(fā)展意義重大。

二十年回望:AI存儲的長征

20多年來,曙光存儲始終聚焦存力平臺建設,以全棧自研技術為核心,從底層硬件到上層軟件實現(xiàn)自主創(chuàng)新,在這個過程中沉淀了豐富的建設經(jīng)驗。曙光存儲副總裁楊志雷表示,曙光存儲通過與運營商、云服務商等合作伙伴深度協(xié)同,累計部署上千套存儲系統(tǒng),構建了高效、可靠的存儲基礎設施。

針對人工智能市場的異軍突起,曙光存儲不斷突破新的天花板,以更高效、更安全更可靠的高速并行分布式文件存儲系統(tǒng)支持大模型訓練的高帶寬需求。2023年起,大模型六小龍中的五家訓練底座已應用曙光全閃,在推理場景,通過優(yōu)化數(shù)據(jù)路徑、存儲上下文信息,實現(xiàn)每秒2000-3000 token的生成速度。

“無論是去年發(fā)布的高速并行分布式文件系統(tǒng)存儲,還是今年即將基于國產(chǎn)化芯片的、追求更極致的兩路兩節(jié)點、190GB/s以上帶寬的存儲性能的節(jié)點,以國際領先水平充分釋放前端的計算平臺的算力能力?!睏钪纠讖娬{(diào)說。

在人工智能應用賽道,無論是訓練還是推理場景,對存儲的需求都有一些差異化。比如訓練場景除了能存能快速訪問,還離不開安全管理,不同的訓練模型相互之間也要實現(xiàn)數(shù)據(jù)隔離。曙光存儲從軟件層面,與基礎設施的性能調(diào)優(yōu)層面都已經(jīng)全面實現(xiàn)了這方面的能力,并且也都付諸了實踐。

以自動駕駛領域為例,曙光存儲定制化方案覆蓋數(shù)據(jù)采集、脫敏、訓練全流程,避免用戶重復采購存儲設備,提升數(shù)據(jù)流動效率,如為某頭部車企定制“路測-脫敏-訓練-仿真”四級存儲池,數(shù)據(jù)在24小時內(nèi)完成3PB流轉(zhuǎn),模型迭代周期從周級壓縮到48小時;在醫(yī)療影像場景,15年PACS冷數(shù)據(jù)被自動分級下沉,院內(nèi)本地盤節(jié)省60%,醫(yī)生調(diào)閱30年前的CT片只需2秒。

可以說,曙光的定制化能力,重新定義了存儲與場景的適配標準。

核心自主創(chuàng)新:構建核心護城河

中科曙光在自主可控領域成效顯著。曙光存儲現(xiàn)有千余名研發(fā)人員,代碼自有率100%。今年5月,集中式存儲在SPC-1榜單以3000萬IOPS、0.202ms延遲登頂世界第一,打破國外高端陣列15年壟斷;技術上,從芯片到軟件全棧自研,“超級隧道”加速技術、國產(chǎn)化芯片適配等核心能力形成競爭壁壘,成為公有云廠商的核心供應商,其國產(chǎn)化成果不僅滿足數(shù)據(jù)安全需求,更在中美科技競爭中凸顯戰(zhàn)略價值,構建起難以復制的技術護城河。

曙光存儲總裁何振表示,性能領先只是第一張門票,全棧可控才是護城河。

應對市場趨勢:全閃存布局與未來方向

面對全閃存市場擴大的趨勢,曙光存儲已實現(xiàn)全閃存儲占比從3年前10%到如今30%的躍升。

在將存力與AI算力相結合應用的創(chuàng)新方面,曙光存儲副總裁張新鳳舉例介紹了曙光存儲兩大努力方向:一是高性能傳承,依托多年高性能計算經(jīng)驗,把“榨干硬件性能”的方法論沿用到AI領域,實現(xiàn)超低延遲,盡可能提升GPU資源的利用率,百倍IOPS、10TB級帶寬,將硬件潛力一次挖盡,二是建立面向行業(yè)的向量數(shù)據(jù)庫,實現(xiàn)精準回答,減少訓練推理的幻覺,從而加速數(shù)據(jù)平權,AI普惠的目標。

曙光存儲用20多年把“存力”從配角推向舞臺中央。隨著智能存力跨域調(diào)度平臺落地,東西部數(shù)據(jù)第一次真正意義上“同盤共舞”,數(shù)據(jù)要素的市場化交易也因此邁出可度量的第一步。

未來,曙光存儲將持續(xù)以技術創(chuàng)新響應國家戰(zhàn)略與市場需求,讓智能存力成為數(shù)字經(jīng)濟發(fā)展的核心引擎。未來,曙光要成為中國的EMC。

分享到

xiesc

相關推薦