英特爾(中國)有限公司服務(wù)器平臺產(chǎn)品經(jīng)理張振宇先生

走向百億億次 混合結(jié)構(gòu)成必然

Q:高性能計(jì)算領(lǐng)域的發(fā)展已經(jīng)有很多年了,英特爾剛剛也發(fā)布了“至強(qiáng)融核”品牌。英特爾為什么要在高性能計(jì)算領(lǐng)域推出這個(gè)品牌?

A:在推動(dòng)千萬億次向百億億次級的過程當(dāng)中,至強(qiáng)扮演著非常重要的角色。至強(qiáng)本身是非常強(qiáng)大的平臺,它能夠適應(yīng)各種各樣的工作負(fù)載。尤其是我們今年3月發(fā)布的至強(qiáng)E5-2600系列處理器,其采用的“AVX”指令集對高性能計(jì)算非常有用,能夠把性能提升5倍。實(shí)際上,至強(qiáng)E5平臺也是高性能計(jì)算歷史上被采用最快的一種技術(shù)。在最新的榜單里,3月份才發(fā)布的產(chǎn)品,到目前為止已經(jīng)有45套在TOP500里出現(xiàn),在新系統(tǒng)當(dāng)中占據(jù)的比例達(dá)到了78%。

但是,要發(fā)展到百億億次,僅僅依賴至強(qiáng)是不夠的,還需要用“至強(qiáng)融核”架構(gòu)來提高高度定型應(yīng)用的計(jì)算效率。這是因?yàn)椋?dāng)計(jì)算規(guī)模達(dá)到一定程度的時(shí)候,CPU和功耗和計(jì)算效率都不足以解決大規(guī)模的計(jì)算問題,這就需要采用例如GPU或協(xié)同處理器等方式進(jìn)行加速。至強(qiáng)本身是通用處理器,能夠適應(yīng)各種各樣的工作負(fù)載。“至強(qiáng)融核”是至強(qiáng)品牌下的一部分,英文名是“Xeon Phi”,Phi是希臘文的第11個(gè)字母,代表黃金分割,有科學(xué)、創(chuàng)新、和諧、完美的喻意,主要是在一些高度定型的應(yīng)用,為數(shù)據(jù)中心、高性能領(lǐng)域以及工作站提供更強(qiáng)的計(jì)算能力。英特爾希望通過它為客戶提供高性能計(jì)算的同時(shí),為客戶實(shí)現(xiàn)創(chuàng)新、達(dá)到完美。同時(shí),“融核”也體現(xiàn)集成眾核的含義。

Q:如您所說,混合架構(gòu)是走向未來高性能計(jì)算的必然趨勢,但這種混合架構(gòu)也包括多種混合方式。例如,早前的GPGPU+CPU方式,就曾在業(yè)績獲得廣泛認(rèn)可。您如何看待融核架構(gòu)的前景?

A:至強(qiáng)融核最大的特點(diǎn)就是“單一源程序”,經(jīng)過簡單編譯可以在至強(qiáng)融核和至強(qiáng)兩種架構(gòu)上同時(shí)運(yùn)行。因?yàn)椴捎昧送ㄓ玫木幊毯烷_發(fā)工具,能夠幫助客戶實(shí)現(xiàn)更有效的計(jì)算。確實(shí)如你所說,GPGPU+CPU模式在高性能計(jì)算領(lǐng)域當(dāng)中已有一些應(yīng)用,但這種模式也有其弊端——會(huì)帶來編程上復(fù)雜性。由于GPGPU和x86架構(gòu)在編程方面有極大的不同,客戶需要花費(fèi)大量時(shí)間學(xué)習(xí)。

作為對比,“至強(qiáng)融核”的“單一源程序”特性為科學(xué)工作者帶來了福音。例如,Altair和SGI用SGI UV2在我們的平臺上進(jìn)行汽車和汽車模擬的碰撞,客戶印象最深的就是編程連續(xù)性,客戶無需為了提升計(jì)算效率而重新學(xué)習(xí)另一種編程語言。實(shí)際上,我們期望至強(qiáng)融核能夠改變高性能計(jì)算游戲規(guī)則。過去,人們鼓吹GPU,利用CPU來進(jìn)行浮點(diǎn)加速來提高計(jì)算性能,但用戶應(yīng)該將精力放在科學(xué)研究上,而不是放在學(xué)習(xí)編程語言上。

Q:至強(qiáng)融核架構(gòu)適合哪些應(yīng)用場景?會(huì)有桌面高性能計(jì)算這類應(yīng)用嗎?

A:在高性能計(jì)算領(lǐng)域,石油、地質(zhì)勘探、氣象、動(dòng)漫渲染、生命科學(xué)以及一部分的金融行業(yè),金融風(fēng)險(xiǎn)分析,這一類應(yīng)用都比較適合至強(qiáng)融核架構(gòu)。在國內(nèi),英特爾也選定了一些目標(biāo)客戶,例如去年就選擇了6個(gè)客戶將其應(yīng)用移植過來。實(shí)際上,這個(gè)過程也是客戶跟我們相互認(rèn)可的過程。同時(shí),我也強(qiáng)調(diào)一點(diǎn),至強(qiáng)融核產(chǎn)品是定位在數(shù)據(jù)中心、工作站、高性能計(jì)算領(lǐng)域。目前主要是著眼在高性能計(jì)算,下一代英特爾會(huì)幫助客戶在工作站里完成并行計(jì)算工作;在數(shù)據(jù)中心當(dāng)中的一些互聯(lián)網(wǎng)應(yīng)用和大數(shù)據(jù)應(yīng)用未來也能從至強(qiáng)融核產(chǎn)品當(dāng)中受益,流媒體監(jiān)控也大有用武之地。

Q:我們發(fā)現(xiàn),榜單上的至強(qiáng)融核混合架構(gòu)的效率是65.53%,未來會(huì)有提升的余地嗎?

A:凡是混合的架構(gòu),它的效率都不會(huì)太高。完全由至強(qiáng)組成的系統(tǒng),其Linpack效率可以達(dá)到90%;但 GPU+至強(qiáng)的結(jié)構(gòu),其效率甚至只有40%多。因此,至強(qiáng)融核混合架構(gòu)的集群效率達(dá)到65%,這已經(jīng)非常不錯(cuò)了。英特爾在國內(nèi)的測試結(jié)果顯示,單節(jié)點(diǎn)效率超過70%。因此,集群效率能夠達(dá)到65%是不錯(cuò)的成績。

CPU不是瓶頸 互聯(lián)才是

Q:現(xiàn)在的融核有大約50顆內(nèi)核,要實(shí)現(xiàn)了億億次計(jì)算,需要多少核?如何解決多核系統(tǒng)之間的通信問題?

A:要實(shí)現(xiàn)百億億次計(jì)算不是簡單地對核進(jìn)行堆疊就能實(shí)現(xiàn)的。英特爾預(yù)測到2018年會(huì)出現(xiàn)百億億次計(jì)算系統(tǒng),這需要互連技術(shù)的進(jìn)展、編程工具的進(jìn)展,以及其他方面的進(jìn)展,這些因素會(huì)直接影響到系統(tǒng)最終的計(jì)算內(nèi)核數(shù)。如果用理論值計(jì)算的話,簡單地用浮點(diǎn)值相乘即可。不過,我相信到2018年,技術(shù)會(huì)比現(xiàn)在有很大的進(jìn)步,所以現(xiàn)在很難準(zhǔn)確預(yù)測系統(tǒng)的內(nèi)核數(shù)。

至于多核系統(tǒng)之間的互聯(lián)通信,這確實(shí)是在發(fā)展百億億次計(jì)算時(shí)急需解決的一個(gè)問題。在高性能計(jì)算領(lǐng)域,有這么一句名言,“計(jì)算是免費(fèi)的,移動(dòng)是昂貴的,”指的就是通信問題。高性能計(jì)算發(fā)展到現(xiàn)在,計(jì)算已經(jīng)不是瓶頸,通信互聯(lián)才是。英特爾本身已有萬兆網(wǎng)卡,在過去一年內(nèi)在互聯(lián)方面投入了很多資源,收購了生產(chǎn)高速交換機(jī)的一家公司、Qlogic和Infiniband業(yè)務(wù)和Cray的互聯(lián)技術(shù)。我們也期待有更新的技術(shù)來幫助解決百億億次規(guī)模集群的通訊問題。,我們本身有萬兆網(wǎng)卡,以太網(wǎng)這樣的產(chǎn)品,去年7月份我們收購了一家公司是“Knights Corner”是生產(chǎn)高速交換機(jī)的廠商,今年收購了Qlogic和Infiniband業(yè)務(wù)和Cray的互聯(lián)技術(shù)。

Q:既然互聯(lián)通信對高性能計(jì)算如此重要,那么,在高性能計(jì)算選型時(shí),英特爾如何向客戶推薦Infiniband技術(shù)和萬兆網(wǎng)技術(shù)?

A:Infiniband和萬兆網(wǎng)各有各的特點(diǎn),萬兆網(wǎng)定義成下一代的統(tǒng)一網(wǎng)絡(luò)(Unified networking),可以把存儲和網(wǎng)絡(luò)整合在一起,能夠提供很大的帶寬,整體的成本也比較好。有的應(yīng)用,例如石油和對計(jì)算帶寬要求不太高的環(huán)境,對計(jì)算延遲要求也不是那么嚴(yán),可以采用萬兆網(wǎng)技術(shù);而對于像氣象、汽車模擬碰撞、移動(dòng),這一類的應(yīng)用就適合應(yīng)用延遲比較低的Infiniband技術(shù)。當(dāng)然,萬兆網(wǎng)技術(shù)的延遲也在逐步降低,縮短了跟Infiniband技術(shù)之間的差距,這時(shí)候,我們會(huì)根據(jù)客戶的應(yīng)用需求看看到底是適合Infiniband還是適合萬兆網(wǎng)。實(shí)際上,高性能計(jì)算的應(yīng)用非常不同,不同的應(yīng)用會(huì)有特別不同的需求。在大規(guī)模超算上,例如Petaflop級別,萬兆網(wǎng)技術(shù)就不是最合適的。

另一個(gè)例子,絕大多數(shù)應(yīng)用都適合在至強(qiáng)上跑,但也有5%到10%的應(yīng)用是高度定制的,例如大數(shù)據(jù)應(yīng)用、動(dòng)態(tài)學(xué)應(yīng)用等等,這些就比較適合融核應(yīng)用。因此,在至強(qiáng)融核產(chǎn)品發(fā)布之前,英特爾就開始就跟行業(yè)內(nèi)的一些互聯(lián)網(wǎng)廠商和最終用戶幫助把合適的用戶移植到至強(qiáng)融核產(chǎn)品上進(jìn)行評估,看看什么應(yīng)用最適合。

超算領(lǐng)域 多極并存

Q:您提到在超算領(lǐng)域,CPU已不再是瓶頸。我們也注意到,在TOP 10榜單中,專有系統(tǒng)還有很大的比例。這是否意味著,超算領(lǐng)域的格局已經(jīng)處于專有系統(tǒng)和x86系統(tǒng)的相對平衡狀態(tài)?

A:這個(gè)情況與應(yīng)用領(lǐng)域的U2L(UNIX 2 Linux) 或者說RISC Migration(RISC遷移)的情況類似。你會(huì)發(fā)現(xiàn),有一些應(yīng)用放在RISC架構(gòu)上有其存在的必然性,超算也一樣。在關(guān)注通用性的時(shí)候,尤其是對一般用戶而言,借助商用的互聯(lián)設(shè)備、用開源軟件來搭建一個(gè)相對低廉的計(jì)算的環(huán)境,這是一個(gè)合適的選擇。但是為了追求極限速度,專有系統(tǒng)有其存在價(jià)值。因此,專有系統(tǒng)并不會(huì)消亡,在頂尖超算系統(tǒng)當(dāng)中,還會(huì)出現(xiàn)專用系統(tǒng)的身影。但大家也可以關(guān)注一下,基于至強(qiáng)處理器的高性能計(jì)算系統(tǒng),在Top 500榜單當(dāng)中是保持了一個(gè)穩(wěn)定上升的趨勢。

Q:在高性能計(jì)算領(lǐng)域,英特爾已有處理器、芯片、互聯(lián)架構(gòu),并且能夠幫助用戶進(jìn)行軟件調(diào)優(yōu),已經(jīng)形成了一條相對完整的產(chǎn)業(yè)鏈。那么,英特爾會(huì)在高性能計(jì)算領(lǐng)域推行平臺化戰(zhàn)略嗎?就好像在筆記本電腦領(lǐng)域推行迅馳平臺一樣?

A:英特爾現(xiàn)在還沒有做平臺化一體機(jī)的想法,但是你會(huì)發(fā)現(xiàn),英特爾逐步從處理器生產(chǎn)商的角色逐步向平臺或者系統(tǒng)供應(yīng)商的角色轉(zhuǎn)換。在高性能計(jì)算系統(tǒng)當(dāng)中,CPU很重要,但整個(gè)系統(tǒng)的效率如何,不僅取決于CPU,還取決于其中的各種子系統(tǒng),例如“內(nèi)存子系統(tǒng)、互聯(lián)通信子系統(tǒng)。英特爾為客戶提供各種各樣的組件,包括Infiniband、萬兆網(wǎng)互聯(lián)的設(shè)備、存儲設(shè)備、計(jì)算設(shè)備,甚至還給出一些主板設(shè)計(jì)模板、軟件開發(fā)工具,通過這些模塊(Building)來幫助客戶搭建自己最適合的系統(tǒng)。但是,英特爾自身并不會(huì)提供一體機(jī)之類平臺化的產(chǎn)品。

分享到

zhaohang

相關(guān)推薦