英特爾數(shù)據(jù)中心事業(yè)部亞太和中國區(qū)高性能計算/工作站方案架構(gòu)師何萬青博士

借著對新公布的全球高性能計算TOP500榜單的分析,何萬青博士介紹了英特爾在高性能計算領(lǐng)域的投資,以及英特爾中國團隊在高性能領(lǐng)域的工作。

TOP500:英特爾優(yōu)勢繼續(xù)擴大

根據(jù)最新公布的全球高性能計算機500強排行榜,英特爾繼續(xù)遙遙領(lǐng)先。在本屆榜單中,有74%的上榜系統(tǒng)采用英特爾架構(gòu),同時新晉榜單的系統(tǒng)中有78%是基于英特爾架構(gòu)。這意味著英特爾的份額有望進一步擴大。

各架構(gòu)在TOP500中的應(yīng)用情況

與此同時,即使是剛剛發(fā)布的英特爾至強E5處理器,已經(jīng)有45套基于至強E5的系統(tǒng)進入TOP500,這其中包括了3套擁有每秒千萬億浮點計算能力的系統(tǒng)。位于萊布尼茨超級計算中心(LRZ)的“SuperMUC”是其中最大的高性能計算機,具備每秒2900萬億次浮點計算能力(2.9 Petaflops),是歐洲計算能力最強的高性能計算機,也是基于x86架構(gòu)的計算能力最強勁的高性能計算機。

何萬青表示,至強E5相比至強5600,性能提升高達80%,而在某些特定狀態(tài)下,能夠?qū)崿F(xiàn)比前代產(chǎn)品節(jié)能達50%。這對于日漸追求能耗產(chǎn)出比的高性能計算用戶具有很強的吸引力。而伴隨著至強E5-2600和E5-4600的相繼到位,下半年會有更多的基于至強E5的系統(tǒng)上榜。

至強融核:百億億次更近一步

即將于2012年年底問世的英特爾眾核(MIC)處理器引起了業(yè)內(nèi)的強烈關(guān)注。在前不久舉行的國際超級計算大會上,英特爾公司宣布未來所有基于英特爾集成眾核架構(gòu)(英特爾MIC 架構(gòu))的產(chǎn)品將采用全新品牌——英特爾至強融核。

英特爾一直將至強融核譽為通往百億億次超級計算機的“捷徑”,從目前英特爾公布的技術(shù)細節(jié)以及英特爾做的樣機來看應(yīng)該能擔(dān)此重任。

英特爾能源及高吞吐計算團隊高級主管工程師菲利浦?蒂埃里博士

英特爾能源及高吞吐計算團隊高級主管工程師菲利浦?蒂埃里博士介紹,英特爾至強融核協(xié)處理器將采用22 納米3-D三柵極晶體管制程技術(shù),可在 PCI-e 插卡形態(tài)下集成超過50顆內(nèi)核和支持最低8GB容量的GDDR5 內(nèi)存。此外,它還具備支持512b SIMD 指令的特點,可在單個指令控制下同時處理多個數(shù)據(jù)元素,從而能顯著提升性能。

在去年使用DGEMM進行的協(xié)處理器現(xiàn)場演示中,英特爾進行了使用單顆“Knights Corner”協(xié)處理器提供超過1TeraFLOPs(每秒1萬億次浮點計算)雙精度實際性能的展示。而在2012年國際超級計算大會上,英特爾使用行業(yè)基準測試工具Linpack (Rmax)展示了同樣超過1 TeraFLOPs 的性能。

英特爾至強融核處理器

英特爾還宣布首個基于英特爾至強融核協(xié)處理器的集群已經(jīng)投入使用,并在本屆高性能計算機500強榜單上位列第150位,其具備了每秒118萬億次浮點計算的性能。

在國內(nèi),英特爾已經(jīng)將“Knights Corner”提供給一些用戶測試和試用。同時,浪潮、曙光、超云等系統(tǒng)廠商已經(jīng)和英特爾至強融核展開前期的合作。

為實現(xiàn)到2018年達到百億億級計算目標的承諾,英特爾還在多個領(lǐng)域進行了大量投資。英特爾最近就收購了Qlogic的Infiniband業(yè)務(wù)和Cray的互連技術(shù),以進一步開拓創(chuàng)新,消除在未來提供可擴展的百億億次級計算平臺所面臨的障礙。

HPC:生態(tài)鏈更加成熟

除了提供更高性能、更低功耗的處理器以及固態(tài)硬盤、高速互聯(lián)技術(shù)外,英特爾還提供了適用于多種操作系統(tǒng)的軟件開發(fā)工具套件——Parallel Studio XE和Cluster Studio XE。兩款產(chǎn)品都融合了英特爾C/C++和Fortran編譯器,支持最新的至強E5處理器、性能與并行庫,以及正確性分析器和性能檔案器,以便最大程度實現(xiàn)應(yīng)用程序性能、代碼質(zhì)量和可靠性。

菲利浦?蒂埃里專門介紹了英特爾Cluster Studio XE,它為英特爾架構(gòu)(IA)集群上的分布式并行計算設(shè)定了新標準。這種高級工具套件具有很高的靈活性,在IA-32和英特爾64位架構(gòu)的基礎(chǔ)上,使基于MPI的應(yīng)用程序性能適用于高度并行、共享內(nèi)存的集群系統(tǒng)。英特爾Cluster Studio XE可輕松編碼、調(diào)試并優(yōu)化基于MPI的集群應(yīng)用程序,以便獲得高至PFLOP級的性能。

為了支持中國高性能計算的發(fā)展,英特爾還和浪潮建立了聯(lián)合實驗室,加大在生命科學(xué)、石油等領(lǐng)域的研發(fā)。此外,英特爾還積極推進英特爾真實應(yīng)用負載計劃和“Cluster Ready”計劃。

其中,“Cluster Ready”計劃是對許多硬件廠商和軟件廠商的產(chǎn)品進行兼容性認證,讓用戶在搭建集群方面不用在選型方面費心思。英特爾“Cluster Ready”可以幫助用戶在采購和使用新平臺時更加簡單。用戶只要選購經(jīng)過英特爾 Cluster Ready認證的應(yīng)用軟件和集群系統(tǒng),就可以確保硬件平臺和軟件應(yīng)用之間的互操作性,獲得性能提升和穩(wěn)定可靠的平臺。

何萬青博士透露,目前英特爾和浪潮、聯(lián)想在“Cluster Ready”計劃方面合作很深,聯(lián)想已經(jīng)有20多套系統(tǒng)通過了驗證。而在真實應(yīng)用負載計劃中,英特爾目前主攻16個節(jié)點的至強E5集群,已經(jīng)在一些科研院校進行實際測試。

總體而言,在英特爾的大力支持和推動下,中國高性能計算的生態(tài)鏈正在日臻完善。而一年一度的英特爾高性能計算研討會,又將是國內(nèi)高性能計算研究和使用者的一場盛會。

分享到

xuzhenxin

相關(guān)推薦