浪潮AIStation實(shí)現(xiàn)了對(duì)人工智能計(jì)算資源的池化管理,創(chuàng)新的GPU多維細(xì)粒度分配策略能夠讓多人同時(shí)使用單張GPU,并且可充分利用閑暇時(shí)間訓(xùn)練任務(wù),最大化發(fā)揮計(jì)算資源的性能,很好的緩解了開(kāi)發(fā)過(guò)程中的作業(yè)排隊(duì)、資源擠占情況。而在任務(wù)完成后,計(jì)算資源會(huì)自動(dòng)釋放資源池,避免長(zhǎng)期占用。

同時(shí),AIStation能夠提供多種資源調(diào)度策略,運(yùn)維人員可以根據(jù)銀行不同業(yè)務(wù)組和開(kāi)發(fā)用戶設(shè)置資源的配額和優(yōu)先級(jí),減少了手工分配和資源協(xié)調(diào)工作。而可視化界面資源管理功能,能夠?qū)崟r(shí)監(jiān)控GPU和CPU等計(jì)算資源的使用情況和資源性能表現(xiàn)、硬件性能和掉卡異常提醒,提供查看整體的GPU使用狀態(tài)的接口,極大的減輕了運(yùn)維人員的工作量,讓運(yùn)維更簡(jiǎn)單更高效。

此外,開(kāi)發(fā)人員可以通過(guò)AIStation平臺(tái),以界面化方式快速提交并行開(kāi)發(fā)任務(wù),秒級(jí)完成任務(wù)的托管。通過(guò)AIStation內(nèi)置的監(jiān)控工具,開(kāi)發(fā)人員可以實(shí)時(shí)查看訓(xùn)練任務(wù)過(guò)程、各個(gè)資源的占用情況和算法情況,可視化快速定位算法的瓶頸或者bug問(wèn)題,更加有針對(duì)性的調(diào)整模型參數(shù),并支持多次提交訓(xùn)練任務(wù),這可以顯著加快算法的迭代次數(shù),從而提高生產(chǎn)效率。

AIStation全面整合AI計(jì)算資源、訓(xùn)練數(shù)據(jù)資源以及AI開(kāi)發(fā)工具,為AI開(kāi)發(fā)提供極致高性能的計(jì)算力支撐,構(gòu)建敏捷高效的一體化AI開(kāi)發(fā)平臺(tái)。目前AIStation已經(jīng)聚合了包含百度、第四范式、英特爾、英偉達(dá)、VMware等數(shù)十家公司的AI框架、模型和工具組件,廣泛應(yīng)用在互聯(lián)網(wǎng)、通信、金融、交通、制造、醫(yī)療等行業(yè)的人工智能業(yè)務(wù)場(chǎng)景中,成為生態(tài)豐富的人工智能資源平臺(tái)。

分享到

zhangnn

相關(guān)推薦