隨著AI大模型快速發(fā)展和規(guī)?;瘧茫瑐鹘y(tǒng)的通算云服務已難以滿足智能化應用和新興場景創(chuàng)新發(fā)展需求,算力云服務加速向智算云服務演進;鑒于多樣化應用場景對智算精度、智算時延要求存在差異,為實現(xiàn)智算資源最大化利用,混合使用高精度和低精度算力將成為新趨勢,在此背景下,AI IaaS更加強調(diào)兼容適配多元異構智能算力。

智算云服務,即智能算力云服務,旨在將AI算力以云服務的方式提供給用戶。作為國內(nèi)領先的云計算服務商,優(yōu)刻得近年來緊抓人工智能時代的發(fā)展契機,依托其在云服務領域的深厚積累與豐富的工程化實踐經(jīng)驗,不斷深耕大模型領域。以自建的內(nèi)蒙古烏蘭察布和上海青浦兩大智算中心為承載,優(yōu)刻得正加速構建智算集群,并推出了全棧式AIGC智算解決方案,助力行業(yè)客戶快速實現(xiàn)AIGC應用的落地與云上創(chuàng)新增長。

在智算基礎設施層面,優(yōu)刻得通過“算力合伙人”的生態(tài)模式,不斷匯聚自建算力、客戶托管算力及社會閑散算力,成功打造了融合算力平臺,助力客戶便捷地獲取算力資源,還以“云平臺”的形式對異構GPU算力集群進行高效管理和運營。目前,優(yōu)刻得自有算力規(guī)模超4700P,并在技術創(chuàng)新和項目落地中不斷取得突破。優(yōu)刻得智算云已成功服務于智譜AI、昆侖萬維、出門問問等眾多企業(yè)與機構。

優(yōu)刻得將技術創(chuàng)新與實際應用緊密結合,不僅提供裸金屬、容器、虛擬機計算、專屬計算區(qū)等基礎設施服務,還涵蓋了從訓練流程優(yōu)化、智算集群調(diào)度、高性能網(wǎng)絡與存儲等一系列技術服務。基于自主研發(fā)的“孔明”智算平臺、高性能并行文件存儲平臺UPFS和大規(guī)模推理平臺,優(yōu)刻得智算云可全方位滿足智能算力供應、底層異構算力資源調(diào)度、模型應用層面的工程化平臺構建、模型微調(diào)與定制化行業(yè)模型、推理應用快速部署等各類需求。其中,孔明智算平臺支持對異構算力調(diào)度、實時監(jiān)測集群狀態(tài),實現(xiàn)斷點續(xù)算和訓練集群的智能調(diào)度和管理;UPFS并行文件存儲則通過GDS技術提高讀寫吞吐能力,實現(xiàn)Checkpoint的快速讀寫;在網(wǎng)絡架構設計上,優(yōu)刻得支持IB和RDMA 高速網(wǎng)絡,降低大模型研發(fā)過程中的網(wǎng)絡延時。通過GPU虛擬化、集群智能調(diào)度、存儲管理等技術創(chuàng)新,有效提高大模型的有效訓練時長、千卡并行計算效率,從而大幅提升智算資源的利用效率。

目前,優(yōu)刻得正積極參與算力互聯(lián)調(diào)度平臺的聯(lián)合共建工作,并已成功接入上海算力交易平臺、長三角(上海)算力互聯(lián)互通平臺、北京算力互聯(lián)互通和運行服務平臺等。以“智算云”的服務模式,優(yōu)刻得為人工智能大模型企業(yè)精準匹配了合適的算力資源,滿足了多元化的算力與應用部署需求。報告最后指出,智算云服務已成為推動AI技術創(chuàng)新和產(chǎn)業(yè)發(fā)展的重要基礎,亟需構建面向未來發(fā)展的生態(tài)體系。

圍繞產(chǎn)業(yè)AI化與AI產(chǎn)業(yè)化的雙重需求,要不斷推進智算服務與具體業(yè)務、場景的深度融合,充分釋放智算服務的價值,打造智算云服務應用示范項目。作為智算云服務先鋒企業(yè),優(yōu)刻得將持續(xù)提升技術創(chuàng)新能力,使得智算云服務更加安全、普惠、易用,不斷推動智算云服務產(chǎn)業(yè)生態(tài)健康發(fā)展,為數(shù)字經(jīng)濟的繁榮提供強大的算力支撐和技術賦能。

分享到

xiesc

相關推薦