當前位置： 主頁 > 技術分類0 > 電子技術0 > 嵌入式系統0 >

Portland Group發佈CUDA C/C++多核x86編譯器

本文作者：admin 點擊： 2012-01-03 00:00

前言：

意法半導體全資子公司、全球領先的高性能運算（HPC）編譯器供應商Portland Group宣佈，擁有最佳化性能且可支援多核x86平台的PGI CUDA C/C++編譯器（CUDA-x86）將於2012年1月與PGI 2012版共同上市發售。

CUDA是NVIDIA開發透過NVIDIA GPU（繪圖處理器）的強大處理性能大幅提升運算性能的平行運算架構。CUDA-x86程式設計模型最初發佈於2010年NVIDIA GPU技術研討會上，旨在將CUDA從繪圖處理器延伸到系統級程式設計模型。CUDA-x86的發佈是x86+GPU架構成為整合平行平台的重要一步。

Portland Group總監Douglas Miles表示：「CUDA-x86 是PGI全力支援的CPU+GPU異質系統程式設計藍圖中重要的里程碑。整合 PGI Accelerator編譯器的基於指令的GPU程式設計模型讓GPU程式設計變得極其容易。程式設計人員透過CUDA擴展架構能夠編寫明確且具很強擴展性的平行演算法，然後針對特定平台自由擴展並深度最佳化演算法。隨著基於加速器的系統普及率不斷提高，我們預計這兩種方法將變得至關重要。」

PGI 的CUDA-x86編譯器將CUDA C/C++視為AMD 和Intel的通用多核x86微處理器本機平行程式設計語言。CUDA-x86可完全支援NVIDIA　CUDA C/C++繪圖處理器程式設計語言，因此，程式設計人員只需重新編譯CUDA應用程式原始程式碼，即可在x86 主處理器執行CUDA程式。

透過使用CUDA-x86程式設計模型，開發人員能夠編譯並最佳化CUDA應用程式，使其能夠執行在基於x86微處理器的工作站、伺服器和伺服器叢集上，無論電腦是否配備NVIDIA GPU加速器。在轉譯為在 x86處理器上執行後，CUDA C/C++應用程式使用Intel和AMD的多核微處理器和SIMD （單一指令複合資料模式）指令集執行平行運算。

PGI CUDA C/C++多核x86編譯器的主要功能：
• 在x86主處理器上對本機 CUDA C/C++語言進行最佳化和平行化處理；
• 在x86主處理器上低成本本機並執行CUDA C/C++語言；
• 使用主處理器內核執行每個CUDA執行緒區塊；盡可能自動消除同步；
• 支援AMD和Intel的最新處理器，支援新的AVX指令；
• 自動內聯內核中所有設備函數，並將Chevron語法轉譯成平行/向量迴路；
• 在x86主處理器上完全支援NVIDIA的CUDA C/C++繪圖處理器程式設計語言；
• 完全支援GPU材質記憶體（texture memory）；
• 支援NVIDIA CUBLAS軟體庫；
• 支援PGI所有的Intel和AMD主處理器最佳化功能。

此外，PGI CUDA C/C++ GPU編譯器預計在2012年中上市，屆時，透過使用PGI Unified Binary™ 技術，在配備GPU時，二進位的可執行程式將能夠使用NVIDIA GPU，如無GPU配備，二進位的可執行程式將預設使用多核x86處理器。

性能資料
在一次主流平行程式設計模型性能對比測試中，PGI使用CUDA-x86版和OpenMP版LBM基準測試工具（屬於Parboil基準測試軟體）對CUDA和OpenMP程式的執行時間進行了對比分析。下表列出了兩個不同程式設計模型的程式執行時間：

基準 OpenMP執行時間 CUDA 執行時間
LBM 221秒 221秒

系統：4核Intel酷睿 i7 920（2.67GHz），12GB記憶體，Red Hat Enterprise Linux 5.3

如欲瞭解詳細的性能資訊，詳情請瀏覽PGI公司網站：http://www.pgroup.com/cuda-x86

價格與供貨
PGI CUDA C/C++多核x86編譯器是預計於2012年1月發佈的 PGI 2012 12.1版的組件。PGI Accelerator C/C++ 授權使用者透過當前的訂閱服務可免費獲得最新版編譯器。PGI產品支援Linux、Apple Mac OS X以及Microsoft Windows等作業系統。用戶在Portland Group網站註冊後，即可獲得15天免費試用。詳情請瀏覽Portland Group公司網站www.pgroup.com。

本月熱點 HOME

欄目熱點 HOME