2018年3月8日--東芝電子元件及儲存裝置株式會社(東芝)宣布成功開發出新款汽車應用影像識別系統級晶片(SoC),與東芝上一代產品相比,該產品使深度學習加速器的速度提升10倍,功率效率提高4倍[1]。該技術成果的詳情已於2月19日在舊金山舉行的2019 IEEE國際固態電路會議(ISSCC)上發表。
自動緊急刹車等先進駕駛輔助系統可提供越來越快速反應等功能,但實現這些功能需要影像識別系統級晶片在低功耗條件下,高速識別道路交通信號和路況。
深度神經網路(DNN)是模仿大腦神經網路的演算法,與傳統模式識別和機器學習相比,DNN的識別處理精度要高得多,預計將會廣泛的應用在車用領域。而採用傳統處理器的DNN影像識別耗時較長,因依賴大量的乘積累加(MAC)計算。同時,採用傳統高速處理器的DNN尚存功耗過高問題。
東芝利用可在硬體上實現深度學習的DNN加速器解決了這一難題。以下為其產品三大特點。
此外,新系統級晶片符合全球汽車應用功能安全標準ISO26262之要求。
東芝將繼續提高所開發的系統級晶片的功率效率和處理速度,且東芝新一代影像識別處理器ViscontiTM5的樣品出貨將於今年九月開始。
產品三大特點
- 並行MAC單元。DNN處理需要大量MAC計算。東芝的新設搭載四個處理器,每個處理器包含256個MAC單元。因此提高了DNN的處理速度。
- 減少了動態隨機存取記憶體(DRAM)存取。傳統的系統級晶片沒有本機記憶體,無法在靠近DNN執行單元的位置保存臨時資料,並且在存取本機記憶體時產生較大功耗。同時,載入用於MAC計算的加權數據也會產生較大功耗。東芝晶片可在DNN執行單元附近執行靜態隨機存取記憶體(SRAM),並將DNN處理分為多個子處理區塊,因此可將臨時資料保存在SRAM內,從而減少了DRAM存取。此外,東芝還在加速器上增加了一個解壓縮單元。可透過解壓縮單元載入預先壓縮並儲存在DRAM中的加權數據。因此,降低了載入來自DRAM的加權數據時產生的功耗。
- 減少了SRAM存取。傳統深度學習需要在處理DNN的每一層之後存取DRAM,因此功耗過高。該加速器在DNN的DNN執行單元中設計有流水線層結構,以便在一次SRAM存取期間執行一系列DNN計算。
深度神經網路 (DNN) 加速器
The developed SoC
註:
[1] 東芝在2015 IEEE國際固態電路會議上發表的一篇論文《針對影像識別應用採用以顏色為基礎的物件分類加速器的1.9TOPS與564GOPS/W異質多核心系統級晶片》中提及的影像識別系統級晶片
台灣地區東芝電子零組件股份有限公司 (TET) 簡介
台灣地區東芝電子零組件股份有限公司(Toshiba Electronic Components Taiwan Corporation),負責東芝在大中華區、東南亞和南亞地區等國家的儲存產品及台灣地區半導體的業務推廣及支援。台灣地區東芝電子零組件股份有限公司為筆記型電腦代工廠商、企業級伺服器儲存商及通路代理商的最佳合作夥伴,並以提供廠商最好的服務、最尖端的科技及最高品質的產品為宗旨。更多資訊,請參考東芝網站:http://toshiba.semicon-storage.com/tw/top.html