點擊查看DOIT直播專題

在IDF2013的技術(shù)課程上,來自英特爾的高級技術(shù)咨詢工程師段小平介紹了《英特爾至強融核協(xié)處理器編譯、調(diào)試和調(diào)優(yōu)的軟件工具》。重點闡述了如何使用英特爾Composer XE進行offload編譯,以及使用英特爾VTune Amplifier XE進行性能調(diào)優(yōu)。英特爾至強融核協(xié)處理器和英特爾至強處理器具有相同的并行編程方法,編程模型如下:

【圖】英特爾至強融核協(xié)處理器工具

英特爾至強融核協(xié)處理器平臺提供了非常豐富的工具,包括源自先進編譯器的業(yè)界領(lǐng)先性能、全面的函數(shù)庫、并行編程模型和深入的分析工具。

【圖】英特爾至強融核協(xié)處理器的工具

使用英特爾Composer XE進行offload編譯

在可運行的主機代碼中加入指示和新的關(guān)鍵字就可以使代碼段運行在基于英特爾集成眾核架構(gòu)(英特爾MIC架構(gòu))的協(xié)處理器上,類似于使用OpenMP指令或者Click Plus關(guān)鍵字在串行代碼中加入并行。

英特爾編譯器同時為兩種目標架構(gòu)生成代碼,無論系統(tǒng)是否擁有協(xié)處理器生成的二進制代碼都可以運行,編譯器通過加入代碼來完成自動傳輸數(shù)據(jù)到協(xié)處理器,這意味著程序員不需要編寫額外的代碼。

offload編譯器的數(shù)據(jù)傳輸時,主機CPU和基于英特爾集成眾核架構(gòu)的協(xié)處理器在硬件上不共享物理或虛擬內(nèi)存。有兩種可用的數(shù)據(jù)傳輸模型:顯示拷貝和隱式拷貝。顯示拷貝是指程序員在offload progma、directive中制定需要在主機和擴展卡之間拷貝的變量,隱式拷貝是指程序要標記出需要在主機和擴展卡之間共享的變量,于是相同的變量在主機和協(xié)處理器代碼中都可以使用。

使用英特爾VTune Amplifier XE進行性能調(diào)優(yōu)

英特爾VTune Amplifier XE可以對應(yīng)用進行分析,哪里在消耗時間?VTune Amplifier XE可以針對最長時間函數(shù)進行優(yōu)化,查看調(diào)用棧,基于遠嗎查看時間開銷。哪里在浪費時間?VTune Amplifier XE可以基于源碼查看緩存缺失區(qū),根據(jù)緩沖區(qū)缺失數(shù)據(jù)排序查看函數(shù);等待過長時間?可以根據(jù)等待時間查看鎖,等待期間使用紅/綠顯示CPU使用率。

分享到

tangrong

相關(guān)推薦