隨著人們將運算、人工智慧(AI)和機器學習(ML)等功能從雲端延伸至邊緣,串連上兆台裝置的創新之舉勢將令人驚奇連連。為了達到這個目標,工程師們正重新思考如何在裝置尺寸、可靠性和效率等方面突破設計的極限。在研發過程中,他們力求功能和架構創新以及IP最佳化,希望能將設計發揮到極致,確保邊緣運算和端點裝置成功運作。
邊緣運算是眾多種類中最需要蛻變的架構,原因在於大多數的邊緣設備體積較小、功耗極低,又受成本限制。 繼專業高效的AI運算出現後, 安謀(安謀) Ethos-N78 NPU隨之問世,該設計具有很高的任務專一性,可以提高AI應用的執行速度,尤其N78 NPU在向量和矩陣運算等ML典型工作上執行速度飛快。Ethos-N78延續優良傳統且容易上手,無論與Cortex-A75或新推出的Cortex-A78搭配,皆有助設計人員縮短產品上市時間,並提高處理一般運算功能的效率。
安謀 Ethos-N78的單核心效能提高2.5倍,每秒可處理1至10兆次浮點運算( TOPs) ,讓全新的沈浸式應用得以實現,也展現了高度設計靈活性。Ethos-N78是全球可配置性最高的NPU,具有100多種獨特的配置選項,讓客戶為特殊工作配置MAC、SRAM和向量引擎的數量。 Ethos-N78可與安謀的A級系統主機CPU和記憶體進行整合,例如Cortex-A75、Cortex-A78 CPU等物件,讓處理器以最佳效率實現高階性能。 Ethos-N78的設計旨在減少動態隨機存取記憶體(DRAM)占用的頻寬,每次推論消耗的數據最多可減少40%,從而提高效率。與前一代產品相比,Ethos-N78的DRAM使用量下降,面積效率則增加多達30%,讓合作夥伴得以用更小的矽晶片面積達成更好效率,並有效降低系統功耗。
安謀物理設計團隊正採用格羅方德®(GF®)的12LP +製程解決方案,為潛力無窮的Ethos-N78進行最佳化,盼在效率上突破設計挑戰。 12LP +為格羅方德最先進的FinFET解決方案,以旗下成功的14奈米/ 12LP平台為師,製造技術純熟。適用於AI / ML應用的安謀 Artisan實體IP更是在功率、性能及面積(PPA)經過最佳化後,讓功能豐富的格羅方德12LP +解決方案如虎添翼。
強強聯手,根基穩固
相較於過去所推出的12LP平台,格羅方德12LP +製程解決方案的效能提高了20%,在功耗上也獲得40%的提升。與其他產業標準節點相比,此技術在效能、動態功耗和面積上也具有相當優秀的競爭力。
Ethos-N78 NPU不但具備無與倫比的靈活性,在效能及功率效率等方面亦有過人之處,如搭配12LP +製程解決方案,我們的合作夥伴將得以盡情發揮終端ML潛力。
為了使這款專業半導體產品更加強大,安謀為格羅方德12LP +製程解決方案開發了一套完善的IP組合,包括基礎IP產品以及針對市場研發的PPA最佳化Cortex-A75 POP IP,讓安謀 CPU的效能表現更有效率。 拜RTL協同最佳化所賜,透過安謀的專業技術,快取記憶體因Cortex-A75 CPU調整PPA後獲得最佳化。過程中的創新思維和RTL皆採用符合產業標準的電子設計自動化(EDA)工具,更在POP IP支援團隊助威下,幫助合作夥伴在縮短上市時間的同時獲得可靠結果。
格羅方德生態系統兼設計解決方案副總裁Mark Ireland表示:「透過格羅方德和安謀的緊密合作,未來將生產出差異化的IP解決方案。安謀為我們的12LP +製程解決方案專門開發出高效安謀 Cortex-A75 POP IP解決方案,讓我們的共同客戶有效縮短上市時間、產出差異化的節能ML/AI應用程序,並發掘他們十足的晶片潛力。 我們也相當期待Ethos-N78 NPU的後續發展,以及它對AI邊緣運算裝置的貢獻潛力。」
透過Artisan帶來最佳調整
安謀 Artisan Physical IP 提供了一套具有兩種標準單元架構的完善平台,包括高效能的9軌元件庫和適用於高密度和低功耗應用的7.5軌元件庫。 這些元件庫含有元件數超過2,500的強化元件集,藉此為應用程式提供特定元件,包括適合最低功耗用的單鰭元件,以及適合最高效能的多重排高元件。
AI / ML應用程式擁有龐大的數學運算需求,這意味著設計人員必須借助加法器、多工器、壓縮器和序向元件等多重輸入元件。 安謀元件庫可提供多種驅動強度,由低至高應有盡有,為電子設計自動化工具提供了廣泛選擇,以迎合最佳的PPA和配置考量。
強化後的單鰭套件(SFK)元件庫內含各類單鰭版元件,可實現多種功能,包括組合功能和序向功能,且不會佔用面積。 這是低功耗設計的最大優勢。低驅動強度的單鰭元件在標準型設計中,會以超過40%的替換率降低動態和耗散功率,節省多達10%的功率。
在面積效率增強(AEB)套件這款新產品中,效能最高的元件可提供二至三倍高度的元件。 在AEB元件中,我們將電源軌下方的虛擬鰭片(dummy fin)轉換為實體鰭片。 具有關鍵元件驅動功能的單、雙及三倍高度元件提升了配置的靈活性,有助於減小面積。 將只有單高度的元件與單雙高度混合元件進行PPA比較時,後者性能提升了將近50MHz,總負餘量(TNS)大幅改善,耗散功率也有所降低。 有了大幅降低的面積與更佳的長寬比例,EDA工具就能橫跨設計類型進行元件選擇。
格羅方德12LP +解決方案擁有9個專為AI應用所設計的記憶體編譯器,負責支援處理器與記憶體之間快速且節能的數據往返。安謀為編譯後的物件提供多種周邊選項,可滿足高效能或低功耗的要求。 漸進式電源門控模式則透過關閉核心或周邊電源以節省功率。所有編譯器也都提供多種可提高效率的功能和範圍最佳化選項。
經過特別最佳化的單軌0.55V低壓編譯器是12LP +記憶體一大創新,記憶體位元格和周邊設備均以0.55V的低壓運作,與雙軌配置相比,它具有極高的功率效率,也減輕了執行時會遇到的挑戰。這款低壓編譯器還能在特定情況下,為0.55V域提供高達1GHz的頻率,實為AI應用的理想選擇。
為了使安謀產品的12LP +處理節點能力更加完善,其設有兩個失效安全(fail safe)的1.8V和3.3V可編程I / O庫,兩種皆具有自動檢測I / O電源模式,也支援2KV HBM和6A CDM。 該產品還內含電網架構(PGA)公用程式,可為Artisan標準單元啟用快速電網,透過為各種功率密度設計創建最佳電網的方式,PPA也能獲得改善,更支援多項安謀標準元件產品,包括單鰭套件、面積效率增強元件和電源管理套件(PMK)。
拜新款安謀 Artisan實體IP問世所賜,再加上它為極具競爭力的格羅方德 12LP +專業解決方案進行最佳化,未來同時連接上兆台裝置的榮景指日可待。 現在就讓你我攜手展開創新之旅吧!