Portland Group發佈CUDA C/C++多核x86編譯器

本文作者:admin       點擊: 2012-01-03 00:00
前言:
意法半導體全資子公司、全球領先的高性能運算(HPC)編譯器供應商Portland Group宣佈,擁有最佳化性能且可支援多核x86平台的PGI CUDA C/C++編譯器(CUDA-x86)將於2012年1月與PGI 2012版共同上市發售。

CUDA是NVIDIA開發透過NVIDIA GPU(繪圖處理器)的強大處理性能大幅提升運算性能的平行運算架構。CUDA-x86程式設計模型最初發佈於2010年NVIDIA GPU技術研討會上,旨在將CUDA從繪圖處理器延伸到系統級程式設計模型。CUDA-x86的發佈是x86+GPU架構成為整合平行平台的重要一步。

Portland Group總監Douglas Miles表示:「CUDA-x86 是PGI全力支援的CPU+GPU異質系統程式設計藍圖中重要的里程碑。整合 PGI Accelerator編譯器的基於指令的GPU程式設計模型讓GPU程式設計變得極其容易。程式設計人員透過CUDA擴展架構能夠編寫明確且具很強擴展性的平行演算法,然後針對特定平台自由擴展並深度最佳化演算法。隨著基於加速器的系統普及率不斷提高,我們預計這兩種方法將變得至關重要。」

PGI 的CUDA-x86編譯器將CUDA C/C++視為AMD 和Intel的通用多核x86微處理器本機平行程式設計語言。CUDA-x86可完全支援NVIDIA CUDA C/C++繪圖處理器程式設計語言,因此,程式設計人員只需重新編譯CUDA應用程式原始程式碼,即可在x86 主處理器執行CUDA程式。

透過使用CUDA-x86程式設計模型,開發人員能夠編譯並最佳化CUDA應用程式,使其能夠執行在基於x86微處理器的工作站、伺服器和伺服器叢集上,無論電腦是否配備NVIDIA GPU加速器。在轉譯為在 x86處理器上執行後,CUDA C/C++應用程式使用Intel和AMD的多核微處理器和SIMD (單一指令複合資料模式)指令集執行平行運算。

PGI CUDA C/C++多核x86編譯器的主要功能:
• 在x86主處理器上對本機 CUDA C/C++語言進行最佳化和平行化處理; 
• 在x86主處理器上低成本本機並執行CUDA C/C++語言;
• 使用主處理器內核執行每個CUDA執行緒區塊;盡可能自動消除同步;
• 支援AMD和Intel的最新處理器,支援新的AVX指令;
• 自動內聯內核中所有設備函數,並將Chevron語法轉譯成平行/向量迴路;
• 在x86主處理器上完全支援NVIDIA的CUDA C/C++繪圖處理器程式設計語言;
• 完全支援GPU材質記憶體(texture memory);
• 支援NVIDIA CUBLAS軟體庫;
• 支援PGI所有的Intel和AMD主處理器最佳化功能。

此外,PGI CUDA C/C++ GPU編譯器預計在2012年中上市,屆時,透過使用PGI Unified Binary™ 技術,在配備GPU時,二進位的可執行程式將能夠使用NVIDIA GPU,如無GPU配備,二進位的可執行程式將預設使用多核x86處理器。

性能資料
在一次主流平行程式設計模型性能對比測試中,PGI使用CUDA-x86版和OpenMP版LBM基準測試工具(屬於Parboil基準測試軟體)對CUDA和OpenMP程式的執行時間進行了對比分析。下表列出了兩個不同程式設計模型的程式執行時間:

基準 OpenMP執行時間 CUDA 執行時間
LBM     221秒             221秒

系統:4核Intel酷睿 i7 920(2.67GHz),12GB記憶體,Red Hat Enterprise Linux 5.3

如欲瞭解詳細的性能資訊,詳情請瀏覽PGI公司網站:http://www.pgroup.com/cuda-x86 

價格與供貨
PGI CUDA C/C++多核x86編譯器是預計於2012年1月發佈的 PGI 2012 12.1版的組件。PGI Accelerator C/C++ 授權使用者透過當前的訂閱服務可免費獲得最新版編譯器。PGI產品支援Linux、Apple Mac OS X以及Microsoft Windows等作業系統。用戶在Portland Group網站註冊後,即可獲得15天免費試用。詳情請瀏覽Portland Group公司網站www.pgroup.com。

電子郵件:look@compotechasia.com

聯繫電話:886-2-27201789       分機請撥:11