當前位置： 主頁 > 新品報到 >

英特爾針對高效能運算與進階分析推出最新技術加速邁向深層分析

本文作者：英特爾點擊： 2016-06-22 11:37

前言：

發表Intel® Xeon Phi™處理器以及Intel®可擴充系統框架的進展以因應市場對效能提升、能源效率、以及可編程性的需求

2016年6月22日--隨著資料數量持續爆炸性成長且日趨複雜，業界需要新的硬體、軟體、以及架構來推動更深層的情資分析，進而加快新發現的腳步，促進商業創新，以及推動機器學習(machine learning)與人工智慧(artificial intelligence)領域新一波的演化。

Intel® Xeon Phi™處理器正是解開這些更深層情資分析的關鍵。Intel® Xeon Phi™產品系列不僅是Intel®可擴充系統框架(Intel® Scalable System Framework，Intel® SSF)的基礎元件，也是整個解決方案的一部分，該解決方案整合了各項關鍵技術，讓用戶容易佈建高效能的叢集系統。

運用Intel® Xeon Phi™處理器系列加速解決最艱鉅的挑戰註一
新款Intel® Xeon Phi™處理器是英特爾首款特別針對高度平行化作業負載量身設計可獨立開機的主機處理器，並率先整合記憶體與網絡技術。作為一款可獨立開機的x86架構處理器，Intel® Xeon Phi™處理器能有效率地擴充，而不會像GPU加速器一樣受限於對PCIe匯流排的依賴。在擺脫這樣的依賴性之後，Intel® Xeon Phi™處理器不只帶來更高的可擴充性，還能比加速器產品處理更加多元的作業負載與組態。

新款Intel® Xeon Phi™處理器整合16GB高頻寬記憶體，為各種受到記憶體限制的作業負載註二提供高達500GB/s穩定的記憶體頻寬，並支援雙埠式Intel® Omni-Path架構(Intel®OPA)，可進一步降低解決方案的成本、耗電、以及佔用的空間。此Intel® Xeon Phi™處理器是建構在開放標準上的泛用型處理器，因此現有的軟體投資在未來仍能發揮效益。

涵蓋眾多應用與環境－從機器學習到高效能運算(high-perfomance computing，HPC)，Intel® Xeon Phi™產品系列協助用戶以更高的效率和規模，更快地解決眼前最艱鉅的運算難題註三。此產品系列還協助用戶運用高效能模型分析與模擬、視覺化、以及資料分析等方法，獲得突破性成果。

Intel® Xeon Phi™的其他特點與效益包括：

• 效能：結合多達72個強大且高效率的核心，具備極寬的向量功能(Intel® Advanced Vector Extensions或AVX-512)，推升了高度平行化運算效能的標竿。
• 可擴充性：提供資料中心等級處理器的擴充性與可靠性，用以運行像是機器學習等高效能作業負載。對於快速訓練複雜的類神經網路而言，擴充效率極為關鍵。
• 可編程性：與Intel® Xeon®處理器維持程式執行碼相容性，能運行任何x86作業負載。這樣的相容性不僅能最佳化資料中心資產的使用率，還能採用通用的編程模型，透過共用的開發者以及重複使用程式碼來提高生產力。
• 投資保護：以泛用型x86處理器架構以及各種開放性標準為基礎，再加上廣大夥伴的產業體系支援，並搭配各種編程程式與市面上流通的工具－造就出優越的彈性、軟體可移植性、以及可重複使用性。

內含Intel® Xeon Phi™處理器系列的系統現已問市，預計今年9月還會有更多產品上市。英特爾至今已累積數萬顆出貨量，預估今年總銷售量將超越10萬顆大關。此產品系列廣泛的產業體系支援，至今已累積超過50家OEM廠商、獨立軟體廠商、以及中介軟體夥伴。欲瞭解詳細資訊，請參閱：www.intel.com/xeonphi/partners。

Intel® Xeon Phi™處理器帶領機器學習邁向更深領域
機器學習需要強大的運算力去運行數學演算法以及處理極其龐大的資料。考量這些挑戰，英特爾推出Intel® Xeon Phi™處理器系列以擴充其機器學習的技術陣容。Intel® Xeon Phi™處理器不僅為機器學習訓練模型提供強悍的效能，藉由可獨立開機的主機處理器所帶來的充裕彈性，還適用於運行多重分析的作業負載。Intel®可擴充系統框架打造的叢集系統，內含Intel® Xeon Phi™處理器並整合Intel® Omni-Path架構，讓資料科學家得以運行複雜的類神經網路，並大幅縮短完成模型訓練的時間。在一個內含32節點的基礎設施中，採用Intel® Xeon Phi™處理器系列的架構可帶來比採用GPU的架構多達1.38倍的擴充性，而且在一個內含128節點的基礎設施中，藉由Intel® Xeon Phi™處理器系列的助力，訓練模型所耗費的時間更是加快50倍註三。

Intel® Xeon Phi™系列與Intel® Xeon®處理器E5系列相輔相成，而Intel® Xeon®處理器E5系列是機器學習最廣泛佈建的基礎架構註四。Intel® Xeon處理器E5 v4產品系列非常適合用在機器學習的評分模型，而且能為各種資料中心作業負載提供優異效能與價值。Intel® Xeon Phi™系列與Intel® Xeon®處理器E5系列共同為開發者帶來一致的編程模型，涵蓋訓練與評分領域，另外還提供一個通用架構，能用來執行高效能運算、資料分析、以及機器學習等作業負載。

全新英特爾可擴充系統框架參考架構
為了小型叢集系統乃至於全球最大的超級電腦所設計的英特爾可擴充系統框架(Intel® SSF)能針對各種運算與資料密集的應用、機器學習、以及視覺化等方面的運算帶來可擴充且均衡的效能。英特爾已發表第一個Intel® SSF參考架構，並針對最佳化HPC系統提供建議的基準硬體與軟體組態。Intel® SFF參考架構背後有兩個參考設計提供支援，內含規範HPC系統需求的技術文件，涵蓋硬體與軟體元素，以及安裝與設定方面的說明。新參考架構與設計方案協助系統廠商簡化設計與驗證流程，並為用戶提供採購指南，協助他們更充分發揮Intel® SSF的價值，並享受廣泛的應用程式移植性。有關新參考架構與設計方案的詳細資訊，請參閱：www.intel.com/SSF。

運用Intel® HPC Orchestrator簡化軟體佈建
Intel® HPC Orchestrator是全新系列的支援產品，將簡化HPC系統軟體堆疊的部署以及後續維護，能減少整合、測試、以及驗證等方面的作業。預計在第四季推出的Intel® HPC Orchestrator產品本身以OpenHPC社群軟體為基礎，另外還提供各種專業服務與技術支援。首款推出的Intel® HPC Orchestrator–Advanced是一個模組化軟體堆疊，這個簡單易用的方案帶來可客製化、效能、以及擴充性。有關Intel® HPC Orchestrator功能特色與效益的詳細資訊，請參閱：www.intel.com/hpcorchestrator。

業界快速採納Intel® Omni-Path架構
Intel® Omni-Path架構(Intel Omni-Path Atchitecture，Intel® OPA)是一個全新端對端網絡解決方案，目標是要讓用戶以低廉成本改進HPC應用的效能，鎖定入門級一直到大規模HPC叢集系統。市場採納熱度快速增溫，出貨量已累積超過8萬個節點，各家系統廠商廣泛提供內含Intel® OPA的交換器與伺服器平台包括：戴爾(Dell)*、富士通(Fujitsu)*、日立(Hitachi)*、惠普(HP)*、浪潮(Inspur)*、聯想(Lenovo)*、NEC*、甲骨文(Oracle)*、廣達(Quanta)*、SGI*、美超微(Supermicro)*、Colfax*及許多其他廠商。

Intel® OPA客戶佈建的重要成果包括：
• 美國能源部CTS-1系統[勞倫斯利福摩爾國家實驗室Lawrence Livermore National Laboratory)、聖地亞國家實驗室(Sandia Laoratory)以及洛斯阿拉莫斯國家實驗室(Los Alamos Laboratory)]採用14,500個節點的Intel® OPA。
• 義大利Cineca運算中心採用超過6,000個節點的Intel® OPA。
• 其他還包括美國國家核能安全局的Tri Labs實驗室(National Nuclear Security Administration’s Tri Labs)、德州先進運算中心(Texas Advancesd Computing Center)、英國赫爾大學(University of Hull)、劍橋大學(University of Cambridge)、德國Alfred Wegener研究院(Alfred Wegener Institute)以及科羅拉多大學(University of Colorado)。

更多資料與多媒體內容請參閱：http://www.intel.com/newsroom/isc。

Intel、Xeon Phi、Omni Path與Intel標誌為英特爾公司在美國與其他國家之註冊商標。

*其他品牌和名稱為其所屬公司的資產。

註一 Intel® Xeon Phi™處理器提供超過3 Teraflops的雙精度運算效能，速度超越Intel® Xeon Phi™協同處理器x100系列的1 Teraflop雙精度運算效能。
註二資料來源：英特爾測量效能的平台內含Intel® Xeon Phi™處理器7250，採用STREAM Triad效能測量程式，在2016年3月進行測試，數據單位為每秒Gigabytes。
註三在一內含128節點的基礎設施中，訓練模型所耗費的時間加快50倍，比較對象為單節點系統，採用AlexNet拓撲作業負載(批量為1024)，訓練時間的測量使用大型映像資料庫，在單節點Intel® Xeon Phi™處理器7250上進行運算(16 GB MCDRAM記憶體、時脈為1.4 GHz、內含68個核心)，系統組態為Intel® Server System LADMP2312KXXX41；96GB的DDR4-2400 MHz記憶體；四叢集模式；MCDRAM扁平記憶體模式；Red Hat Enterprise Linux* 6.7 (Santiago)作業系統；容量1.0TB的SATA介面碟機WD1003FZEX-00MK2A0作為系統碟；運行Intel® Optimized DNN Framework。請聯絡英特爾業務代表查詢如何取得機器運行碼。在32節點系統上提高38%的擴充效率，採用的是GoogLeNet深層學習影像分類訓練拓撲，採用一個大型影像資料庫，比較單節點Intel® Xeon Phi™處理器7250 (16 GB MCDRAM記憶體、時脈1.4 GHz、內含68個核心)；使用和上述相同的組態；運行Intel® Optimized DNN Framework達到87%的效率，和運行32個NVIDIA Tesla* K20 GPU的未知主機相比達到62%的效率(資料來源：http://arxiv.org/pdf/1511.00175v2.pdf)。

註四英特爾的推測是根據英特爾內部Xeon E5處理器銷售數據以及顧客回饋。

效能測試中使用的軟體與作業負載，可能僅針對英特爾微處理器進行最佳化。包括SYSmark與MobileMark在內的效能測試，是使用特定電腦系統、零組件、軟體、作業、與功能進行測量。這些因素若有任何異動，均可能導致測得結果產生變化。建議您參考其他資訊與效能測試數據，協助您充分評估欲購買產品的效能，包括該產品在搭配其他產品運作時的效能。

完整資訊請上網參閱：http://www.intel.com/performance。

英特爾處理器的型號並非衡量效能的依據。處理器型號用來區別每個處理器系列的各項功能特色，不同系列處理器的型號代表的意義並不互通。詳情請參閱：http://www.intel.com/performance。

英特爾技術的特色與效益，端視系統組態而定，可能需用到有支援的硬體、軟體、或啟用相關服務。實際效能會依系統組態而異。沒有電腦系統能提供絕對的安全性。文中提及成本降低的情境，目的僅作為搭載英特爾技術產品的例子，說明在特定情況與組態下的結果，這些因素可能影響未來成本與所提供的成本節約幅度。實際情況可能有所不同。英特爾並不擔保任何成本或成本降低金額。

文中提及所有日期與產品僅作規劃之用，日後可能有所異動，恕不另行通知。

每項效能測量的相對數據，是以第一個受測平台的實際效能測量結果作為基準，將其值設為1.0基值。其餘受測平台的相對效能，則是將測得數據除以基準平台的數值，所得到的比值就是文中提及效能改進的幅度。

本文並無授予任何(包括明示或暗示，且不論是否有依照禁止反言或其他原則)智慧財產權。

英特爾並未以明示或暗示方式提供任何保證，包括以下但範圍不限於：暗示方式保證適售性、特定用途的合適性、無侵權、以及履約過程/交易過程/行業慣例方面的任何保證。

關於英特爾
英特爾(NASDAQ：INTC)拓展科技的疆界以帶來最驚艷的使用經驗。想了解更多英特爾的訊息及其超過10萬名員工在工作上的成就，請至英特爾新聞室newsroom.intel.com及intel.com查詢。

本月熱點 HOME

欄目熱點 HOME