華中科技大學BSDE應用成績突出

筆者與華中科技大學溝通了解到,華中科技大學對計算金融BSDE應用優(yōu)化后,與優(yōu)化前的CPU串行程序狀態(tài)相比,性能實現(xiàn)了6萬倍的提升,其中6萬加速比的結果中有300多倍來自并行化、向量化、訪存等優(yōu)化,200多倍來自算法的優(yōu)化,充分展示了對應用的深度了解。

ASC13亞洲大學生超算決賽揭曉冠、亞軍

華中科技大學獲ASC13大賽MIC應用優(yōu)化獎

從規(guī)則來看,參賽隊需要在3000瓦功耗限制下自行設計搭建超級計算機系統(tǒng),并進行HPL、GROMACS、OPENCFD、WRF、BSDE 等5項優(yōu)化測試,在方案和策略方面,不同高校代表隊各具特色,構建的超算平臺差異性很大,規(guī)模最大的采用了9個節(jié)點,最小的采用了4個節(jié)點,既有 CPU+GPU混合集群,也有全部采用MIC的眾核集群,尤其是BSDE應用,其要求為基于單至強融核協(xié)處理器超算平臺的應用并行化設計實現(xiàn)及性能優(yōu)化。

探秘:華中科大MIC架構實現(xiàn)6萬倍加速比

華中科技大學決賽現(xiàn)場

筆者深入了解到,華中科技大學通過研讀浪潮-英特爾中國并行計算聯(lián)合實驗室的《MIC高性能計算編程指南》,對英特爾集成眾核(MIC)架構的特點和應用優(yōu)化方法有了全面的認識,采用至強融核協(xié)處理器應用加速的實施:

在小規(guī)模算例上,采用在CPU上啟動任務,將全部計算過程以offload模式交由英特爾至強融核協(xié)處理器完成的方案,對于大的算例則采用CPU與至強融核協(xié)處理器協(xié)同計算,通過offload signal/wait方式將一部分計算任務交由至強融核協(xié)處理器異步完成。

另外,對于不同方案之間的臨界點,則根據(jù)現(xiàn)場實測結果用MATLAB進行曲線擬合分析得到。在以上方案的基礎上,華中科技大學還采用優(yōu)化數(shù)據(jù)訪問方式、算法模型優(yōu)化等方法加快應用運行。

此外,他們還將應用熱點中的多次計算任務合并成一次計算任務,并提到循環(huán)外,避免重復計算,使用訪存的時間代替計算任務執(zhí)行的時間,大大提高了并行應用性能。

由此,華中科技大學取得的成績表明對英特爾集成眾核(MIC)技術理解,充分掌握了相關并行編程模式和算法優(yōu)化技巧?;谟⑻貭柤杀姾?MIC)架構的加速技術具備高并行化和易上手的特點。

分享到

yuanjiaju

相關推薦