從功耗說開去:至強與至強融核的分工
DOIT原創(chuàng) 崔昊 發(fā)表于:12年11月27日 19:00 [原創(chuàng)] DOIT.com.cn
從功耗說開去:至強與至強融核的分工
除了性能提升,我們還要看一下功耗的問題。正如前文所說,沒有性能/功耗比的提升,沒有每瓦性能的提高,即便是性能再高也是無以為繼的系統(tǒng),我們不可能毫無止境的堆疊處理器,更不能毫無功耗峰值的建設高性能計算系統(tǒng)(個人計算機、工作站也是一樣)。
在處理并行計算任務時,5110P的能效比大約為4.49GFlops/Watts,兩款特殊版本至強融核的數(shù)值大約為3.577 GFlops/Watts,這個數(shù)字是當年的Clovertown 0.35 GFlops/Watts(約)的12倍和10倍。
以過去兩代比較主流的至強處理器至強E5-2690和至強5680來看,至強融核的性能功耗比也有所上升。雖然無法準確的得到這兩款處理器與至強融核運行同樣并行程序時的結果,但是以處理器算術運算測試與該處理器的TDP數(shù)值相比,還是能夠得到一定的結果。
在運行相同的SiSoftware Sandra Pro Business 2012處理器算術運算測試(Processor Arithmetic Benchmark)時,兩者分別能夠獲得320.9和207GFlops的性能數(shù)值(Whetstone iSSE3,浮點運算),而兩款處理器的TDP數(shù)值分別為135W和130W,也就是說能效比大約為2.377 GFlops/Watts和1.592GFlops/Watts。
當然,我們暫時還無法獲得在同樣的并行程序下,至強處理器與至強融核的能效比的差距,但是很明顯的一個問題是:我們不可能要求所有的應用都是并行的,固然至強處理器有可以在并行模型下獲得更快的性能,極大的縮短與至強融核的性能差距,但是至強處理器畢竟還要去處理很多復雜的工作任務。
這也就意味著,在目前更多混合工作負載的環(huán)境的前提下,高度并行任務自然交予至強融核會有很出色的成績,但是給至強處理器也會有不錯的表現(xiàn);普通并行的程序交給至強處理器就可以滿足性能的需要和并行處理性能的提升;在混合了并行和串行的環(huán)境中,協(xié)同使用至強融核與至強處理器,分別分配并行和串行的任務,自然是更好的一種結果。
在更進一步來談至強處理器和至強融核的工作分配之前,我們要再談談上面的性能比較話題。話說回到上面的SAXPY,這是一個在 Basic Linear Algebra Subprograms(BLAS)數(shù)據(jù)包中的函數(shù),并且是一個并行向量處理機(vector processor)中常用的計算操作指令。SAXPY是純量乘法和矢量加法的組合,但是需要注意的是,其中的純量和矢量、是單精度的,而并非是雙精度的,雙精度的是DAXPY和ZAXPY兩個計算模型。
在上面的結果中我們看到,單精度并行計算中,至強融核比至強處理器高出2.3倍,而我們還沒有相關的數(shù)據(jù)測試雙精度并行計算的性能差距,但是從常理來判斷,在雙精度上至強融核的性能優(yōu)勢應該會更加明顯,而雙精度浮點高并行度計算,也是當今高性能計算混合架構的計算負載主流——在更為常見雙精度浮點的高并行度計算中,至強融核顯然有更明顯的優(yōu)勢。
至強與至強融核的分工非常明確,使用模式也很明確
最終,大致就是以下四種情況:
1、 如果任務都是串行的,也沒有并行化的計劃甚至是可能,那么至強處理器仍然是最好的選擇,至強融核的性能表現(xiàn)會非常低。
2、 高度并行計算(Highly Parallel Computing),對于高度并行的任務來說,至強融核大約比至強處理器有2倍以上的優(yōu)勢,自然適合采用至強融核。
3、 一般性并行計算(General Parallel Computing,或稱通用并行計算),至強融核每瓦性能并不突出,至強E5處理器也可以應付得來,將代碼并行化后,至強也能夠獲得極高的提升,同時還可以處理器串行負載。
4、 高度并行但存在串行的混合工作負載,由至強處理器負責串行和優(yōu)先級不高的并行部分;優(yōu)先級且高度并行的部分,交由至強融核來處理器,或者所有并行部分都由至強融核處理器,形成存在面向高度并行的混合負載的混合計算架構。
至強和至強融合能夠為串行、通用并行和高度并行的多種工作負載提供強大的支撐
隨著并行編程的普及,以及越來越多的HPC程序進行并行化處理器,第二種和第四種情況會越來越多的出現(xiàn)。Joe也在德州高級計算中心的參觀活動中表示,英特爾認為至強處理器更適合一般性并行計算,卻也能應付一定的高度并行計算,但至強融核只是適合于高度并行計算,主要面向“動態(tài)的數(shù)據(jù)流、復雜模型的并行處理”,而對一般并行計算(通用并行計算)并不適合。