開源開放加速全球化協(xié)作,推動(dòng)AI普惠
開源大模型(如Llama3、DeepSeek、Qwen、GLM、MiniMax)的意義已超越技術(shù)本身,深刻重塑全球AI產(chǎn)業(yè)格局和發(fā)展路徑。它們大幅降低了獲取、部署和定制先進(jìn)AI能力的門檻,使各類企業(yè)與個(gè)人開發(fā)者都能便捷利用頂尖技術(shù),推動(dòng)研發(fā)范式從封閉走向開放協(xié)作,顯著降低技術(shù)壁壘,加速實(shí)現(xiàn)“智能平權(quán)”。與之伴生的是,公共云平臺(tái)和模塊化AI基礎(chǔ)設(shè)施的普及,為開源模型的規(guī)?;涞睾蛻?yīng)用創(chuàng)新提供了至關(guān)重要的開放算力基礎(chǔ)。這種開源模型與開放算力的結(jié)合,會(huì)有效驅(qū)動(dòng)海量長尾應(yīng)用爆發(fā),進(jìn)一步加速AI普惠的實(shí)現(xiàn)。
OCP基金會(huì)高級(jí)總監(jiān)Michael Schill表示,“過去的十?dāng)?shù)年間,開放計(jì)算項(xiàng)目(OCP)所建立的全球化協(xié)作創(chuàng)新模式成功開發(fā)及實(shí)施了數(shù)以百計(jì)的項(xiàng)目,在極大激發(fā)創(chuàng)新活力的同時(shí)也重塑著數(shù)據(jù)中心產(chǎn)業(yè)。隨著AI日益成為社區(qū)成員關(guān)注的核心場景,OCP的工作重心正轉(zhuǎn)向AI主導(dǎo),所有核心工作圍繞著AI開放系統(tǒng)(Open Systems for AI)戰(zhàn)略計(jì)劃展開,包括數(shù)據(jù)中心物理基礎(chǔ)設(shè)施、數(shù)據(jù)中心IT基礎(chǔ)設(shè)施和系統(tǒng)管理三個(gè)重點(diǎn)領(lǐng)域,并且發(fā)布了《可擴(kuò)展基礎(chǔ)設(shè)施的藍(lán)圖》,這是AI開放系統(tǒng)戰(zhàn)略計(jì)劃當(dāng)中的重要工作成果。”
OCTC秘書長陳海認(rèn)為:“產(chǎn)業(yè)協(xié)同創(chuàng)新要從應(yīng)用出發(fā)、從用戶思維出發(fā),堅(jiān)持標(biāo)準(zhǔn)引領(lǐng)產(chǎn)業(yè)發(fā)展,制定更切實(shí)落地的規(guī)范標(biāo)準(zhǔn),推動(dòng)和加速數(shù)據(jù)中心各領(lǐng)域的技術(shù)創(chuàng)新與成果普惠,讓更多的組織和個(gè)人從中獲益。例如,面向多元計(jì)算資源組合和多應(yīng)用場景的服務(wù)器算力算效評(píng)估基準(zhǔn),就是通過系統(tǒng)評(píng)估服務(wù)器整機(jī)的綜合算力與能效表現(xiàn),為行業(yè)提供科學(xué)、可信的算力算效評(píng)估體系,為用戶服務(wù)器架構(gòu)選型和優(yōu)化提供標(biāo)準(zhǔn)范式?!?/p>
針對指數(shù)級(jí)增長的智算需求,OCTC與OCP聚焦現(xiàn)階段用戶需求與產(chǎn)業(yè)技術(shù)方向,正在探討如何加強(qiáng)雙方在開放算力、液冷等方面的合作,兩大社區(qū)的互通合作將形成一個(gè)更加融通的、更多地區(qū)、國家和行業(yè)通行的國際化標(biāo)準(zhǔn),讓底層技術(shù)實(shí)現(xiàn)全球共享,加速技術(shù)普惠。
聚焦當(dāng)下:創(chuàng)新超節(jié)點(diǎn)架構(gòu)凸顯產(chǎn)業(yè)鏈融合創(chuàng)新之力
毋庸置疑,開放計(jì)算的興起與日益壯大,使得數(shù)據(jù)中心產(chǎn)業(yè)鏈的協(xié)同效應(yīng)更緊密、融合創(chuàng)新能力更強(qiáng),這一點(diǎn)對于飛速迭代的AI產(chǎn)業(yè)至關(guān)重要。
目前,MoE大模型的參數(shù)量仍在保持高速增長且迭代迅速,對單系統(tǒng)的算力密度與互聯(lián)速率提出極致要求,帶動(dòng)了計(jì)算架構(gòu)的變革。此次大會(huì)重點(diǎn)探討并集中展示了創(chuàng)新的超節(jié)點(diǎn)計(jì)算架構(gòu),在高速互聯(lián)、通信協(xié)議、內(nèi)存控制、系統(tǒng)架構(gòu)設(shè)計(jì)等層面實(shí)現(xiàn)全維度創(chuàng)新,能夠滿足萬億級(jí)別參數(shù)MoE大模型應(yīng)用需求,凸顯出開放計(jì)算的產(chǎn)業(yè)鏈融合創(chuàng)新之力。
2025 OCTC輪值主席、中國移動(dòng)通信有限公司研究院副院長段曉東指出,MoE大模型持續(xù)推高大算力,仍然是今天的時(shí)代主題,產(chǎn)業(yè)將會(huì)很快邁入以超節(jié)點(diǎn)這種網(wǎng)絡(luò)和算力、軟件和硬件全面協(xié)同優(yōu)化的一個(gè)時(shí)代。超節(jié)點(diǎn)打破了傳統(tǒng)服務(wù)器的物理邊界,觸發(fā)了系統(tǒng)性變革,互聯(lián)技術(shù)成為提升集群有效算力的關(guān)鍵。隨著卡間互聯(lián)技術(shù)的發(fā)展,開放互聯(lián)架構(gòu)將在下一代智算集群中發(fā)揮重要作用。
阿里云基礎(chǔ)設(shè)施異構(gòu)硬件和系統(tǒng)資深總監(jiān)盧曉偉表示,超大規(guī)模MoE帶來了AI基礎(chǔ)設(shè)施的算力、互聯(lián)、能耗瓶頸,以及可靠性和穩(wěn)定性的挑戰(zhàn),需要為AI重構(gòu)算力系統(tǒng),Scale Up 超節(jié)點(diǎn)架構(gòu)將成為核心發(fā)展路徑。超節(jié)點(diǎn)架構(gòu)所需的關(guān)鍵技術(shù)包括原生語義、極致帶寬、極低時(shí)延和高可靠的鏈路,軟硬件協(xié)同是命脈。
三星電子副總裁、先行開發(fā)團(tuán)隊(duì)負(fù)責(zé)人張實(shí)完表示,MoE大模型帶來的超高數(shù)據(jù)傳輸需求,驅(qū)動(dòng)內(nèi)存在高性能、高密度、散熱管控、安全性等方向持續(xù)演進(jìn)。未來,超節(jié)點(diǎn)架構(gòu)將會(huì)采用GPU發(fā)起式直連內(nèi)存,通過GPU友好型介質(zhì)與存儲(chǔ),有效減少內(nèi)存瓶頸,為大模型訓(xùn)練推理提供強(qiáng)力支持。
字節(jié)跳動(dòng)服務(wù)器架構(gòu)師高曉軍表示,服務(wù)器開放架構(gòu)的進(jìn)化,本質(zhì)是通過技術(shù)迭代更好地釋放多樣性算力潛能。開放架構(gòu)的持續(xù)進(jìn)化,如同為算力基座注入 “自適應(yīng)基因”,使其既能兼容當(dāng)下的多樣性算力,又能支撐未來的技術(shù)創(chuàng)新。當(dāng)產(chǎn)業(yè)鏈各方以開放心態(tài)共建標(biāo)準(zhǔn)、共享技術(shù)、共拓場景,多樣性算力將不再是分散的“孤島”,而是互聯(lián)互通的 “大陸”。
浪潮信息副總經(jīng)理趙帥強(qiáng)調(diào),開放計(jì)算社區(qū)的核心目標(biāo)就是利用生態(tài)力量打破性能瓶頸,推動(dòng)業(yè)務(wù)創(chuàng)新發(fā)展,這是一種系統(tǒng)化思維與應(yīng)用價(jià)值導(dǎo)向。超節(jié)點(diǎn)架構(gòu)本質(zhì)上也是系統(tǒng)化思維的產(chǎn)物,它不是某一個(gè)點(diǎn)的突破,而是在現(xiàn)有技術(shù)、生態(tài)和成本約束下,從系統(tǒng)層面去打破芯片本身的性能邊界,最大化用戶價(jià)值。作為社區(qū)的一員,浪潮信息后續(xù)將向社區(qū)成員開放自研的超節(jié)點(diǎn)架構(gòu)設(shè)計(jì)以及PD分離框架,推動(dòng)開放超節(jié)點(diǎn)架構(gòu)的發(fā)展。
展望未來:GW級(jí)AI數(shù)據(jù)中心驅(qū)動(dòng)更緊密的跨社區(qū)協(xié)作
隨著AI計(jì)算需求的持續(xù)爆發(fā)式增長,單機(jī)柜功率將從當(dāng)前的100+kW躍升至未來的1MW以上,AI數(shù)據(jù)中心的電力需求也將步入GW級(jí)。AI數(shù)據(jù)中心正在從“機(jī)柜級(jí)密度革命”邁向“數(shù)據(jù)中心級(jí)系統(tǒng)工程挑戰(zhàn)”,更需要全球產(chǎn)業(yè)鏈開放協(xié)同,優(yōu)勢互補(bǔ),共同應(yīng)對挑戰(zhàn)。
GW級(jí)AI數(shù)據(jù)中心的建設(shè),首要考慮電力供給的問題,能源基礎(chǔ)好、電力成本低是重要的發(fā)展前提。在這一點(diǎn)上,中國具備顯著的能源基礎(chǔ)設(shè)施優(yōu)勢特別是新能源。數(shù)據(jù)顯示,2025年一季度新增裝機(jī)90%來自于可再生能源,全國可再生能源發(fā)電量達(dá)8160億千瓦時(shí),約占全部發(fā)電量的35.9%。但能源優(yōu)勢并不意味著全部,GW級(jí)AI數(shù)據(jù)中心在中國的落地仍面臨諸多挑戰(zhàn),如開發(fā)更穩(wěn)定高效的全光互聯(lián)方案、更好的能效管理技術(shù)、更優(yōu)的基建模式等等,不僅需要產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié)的協(xié)同創(chuàng)新,更需要社區(qū)間的跨社區(qū)協(xié)作,推動(dòng)技術(shù)共享、產(chǎn)品開發(fā)、標(biāo)準(zhǔn)制定等方面的工作。
事實(shí)上,GW級(jí)AI數(shù)據(jù)中心對算力生態(tài)帶來的重要變革,已經(jīng)推動(dòng)了跨社區(qū)合作的進(jìn)程加快。目前,OCP正在籌備成立“GW級(jí)開放智算中心OCP中國社區(qū)小組”,結(jié)合中國在能源、算力基礎(chǔ)設(shè)施與供應(yīng)鏈方面的需求與優(yōu)勢,推動(dòng)AI開放系統(tǒng)戰(zhàn)略計(jì)劃在中國的落地。同時(shí),OCP也在同OCTC積極合作,探討將OCP領(lǐng)先的AI基礎(chǔ)設(shè)施技術(shù)架構(gòu)、參考方案、前沿研究成果等在中國市場落地,在中國建立GW級(jí)AI數(shù)據(jù)中心的全球性標(biāo)桿。
未來,開放計(jì)算技術(shù)大會(huì)將致力于打造全球開源開放聯(lián)合體,為數(shù)據(jù)中心產(chǎn)業(yè)鏈上下游搭建起全球鏈接協(xié)作平臺(tái),推動(dòng)不同國家和地區(qū)的開發(fā)者參與開放計(jì)算項(xiàng)目,加強(qiáng)產(chǎn)業(yè)鏈互聯(lián)互通和開放協(xié)作,推動(dòng)全球供應(yīng)鏈創(chuàng)新融合發(fā)展,進(jìn)而增強(qiáng)社區(qū)的多元化和包容性。