產(chǎn)品發(fā)布會(huì)上,英特爾圈重點(diǎn)介紹了七大算力神器,比如,提高機(jī)器學(xué)習(xí)運(yùn)算力的AMX,提高網(wǎng)絡(luò)負(fù)載處理能力的DLB,提高內(nèi)存數(shù)據(jù)分析的加速器IAA,為提高提高HPC算力采用HBM的CPU Max系列等。

英特爾強(qiáng)調(diào)新的功能特性是結(jié)合用戶的需求來(lái)打造的,很多用戶都在積極采用新功能特性。

發(fā)布會(huì)現(xiàn)場(chǎng),騰訊云介紹了AMX加速器加速AI計(jì)算負(fù)載的使用體驗(yàn),中國(guó)電信天翼云分享了使用英特爾DLB提升服務(wù)能力的細(xì)節(jié),京東云介紹了英特爾IAA加速器在數(shù)據(jù)庫(kù)場(chǎng)景的實(shí)用價(jià)值。

字節(jié)跳動(dòng)是互聯(lián)網(wǎng)時(shí)代的新巨頭,旗下有今日頭條、抖音等多款熱門(mén)App,對(duì)于IT資源的需求量非常大,火山引擎是字節(jié)跳動(dòng)旗下的云服務(wù),是字節(jié)跳動(dòng)多種在線服務(wù)的底層技術(shù)支撐。

在火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人羅浩看來(lái),云產(chǎn)品最終是為了客戶業(yè)務(wù)增長(zhǎng)去服務(wù)的,在做好增長(zhǎng)的基礎(chǔ)之上,火山引擎會(huì)關(guān)注如何在資源層面獲得更好的成本優(yōu)勢(shì),因此,火山引擎云基礎(chǔ)團(tuán)隊(duì)累積了非常多成本優(yōu)化的經(jīng)驗(yàn)。

火山引擎基于第四代至強(qiáng)可擴(kuò)展處理器發(fā)布了彈性計(jì)算實(shí)例,使得單核能力、網(wǎng)絡(luò)轉(zhuǎn)發(fā)能力,加解密、視頻和AI推理訓(xùn)練能力上,都獲得了大幅提升。內(nèi)部測(cè)試結(jié)果顯示,新處理器帶來(lái)了30%以上的整體收益,如今,火山引擎的技術(shù)架構(gòu)正在切換到更具性價(jià)比的方案上。

在談到新的算力神器時(shí),羅浩表示,火山引擎其實(shí)已經(jīng)用了多個(gè)算力神器,比如,此前就在用QAT技術(shù),用于加速AI算力的VNNI向量計(jì)算,整體上,火山引擎應(yīng)用了英特爾發(fā)布的很多加速器的能力。

很多技術(shù)進(jìn)步的意義就在于提高效率,英特爾原來(lái)強(qiáng)調(diào)的是用更高主頻和更多核心來(lái)提升效率,而現(xiàn)在,則更強(qiáng)調(diào)通過(guò)特定的加速器來(lái)支持特定的業(yè)務(wù)邏輯,從而降低功耗并提升性能。

具體差別有多大呢?

從英特爾專家的介紹中了解到,同樣一個(gè)功能分別由軟件和硬件來(lái)實(shí)現(xiàn)時(shí),性能有時(shí)候會(huì)有10-100倍的差距。通過(guò)硬件來(lái)實(shí)現(xiàn)功能時(shí),會(huì)讓一些邏輯固化后內(nèi)置到硬件中,它的功耗便會(huì)大幅度降低,效率就有幾十倍上百倍的變化。

加速器的做法有助于提高效率,但是,隨著集成的功能越來(lái)越多,意味著制造工藝會(huì)變復(fù)雜,成本會(huì)變高,而且,長(zhǎng)遠(yuǎn)來(lái)看,處理器本身會(huì)越來(lái)越臃腫,必然會(huì)存在用不到某些功能而浪費(fèi)的情況。

于是,這一代至強(qiáng)可擴(kuò)展處理器在成本和功能特性上做了開(kāi)創(chuàng)性的變化,新推出的On Demand服務(wù)模式,將改變行業(yè)的消費(fèi)模式,從CAPEX專向OPEX,用戶可以按照需求單獨(dú)開(kāi)啟或者關(guān)閉以下幾個(gè)功能,包括:

英特爾動(dòng)態(tài)負(fù)載均衡器DLB、英特爾數(shù)據(jù)流加速器DSA、英特爾存內(nèi)分析加速器IAA、英特爾數(shù)據(jù)保護(hù)與壓縮加速技術(shù)QAT和英特爾軟件防護(hù)擴(kuò)展SGX。

On Demand服務(wù)模式下,企業(yè)可以在初次購(gòu)買(mǎi)的時(shí)候選擇全功能的處理器,也可以在后期使用過(guò)程中,根據(jù)需求隨時(shí)開(kāi)啟和關(guān)閉某些功能,最終,按照實(shí)際的使用量來(lái)付費(fèi)。

在外界看來(lái),On Demand服務(wù)模式可以有兩種截然不同的走向:

一種是以基礎(chǔ)款(沒(méi)有開(kāi)啟任何功能)處理器的定價(jià)為基準(zhǔn),用戶開(kāi)啟新的功能需要額外付費(fèi)時(shí),相當(dāng)于用戶承擔(dān)了額外成本;

另一種情況下,以完全功能的處理器為基準(zhǔn)價(jià)格,少開(kāi)啟一些功能就少付一些費(fèi)用,而且,僅在需要的時(shí)候開(kāi)啟功能,不需要的時(shí)候關(guān)閉即可。

我個(gè)人傾向于認(rèn)為是第二種邏輯,也就是要幫用戶省錢(qián),或者說(shuō)是控制成本。同時(shí),這還能為用戶帶來(lái)更多靈活性和自定義的空間,用戶在選購(gòu)第四代至強(qiáng)可擴(kuò)展處理器時(shí)應(yīng)該考慮場(chǎng)景來(lái)做決策。

從實(shí)際落地來(lái)看,On Demand服務(wù)模式更適合互聯(lián)網(wǎng)公司或者云服務(wù)商,總之是有大規(guī)模數(shù)據(jù)中心的用戶,這些用戶通常都比較懂技術(shù),會(huì)結(jié)合需求做一些更有針對(duì)性的調(diào)整,從而降本增效。

定制處理器定制的是核心數(shù)目或者核心頻率方面,而On Demand服務(wù)模式定制的是功能特性,未來(lái),兩種定制模式應(yīng)該會(huì)共存。

分享到

zhupb

相關(guān)推薦