多重視訊編解碼標準下的處理器引擎變革

本文作者:admin       點擊: 2007-02-08 00:00
前言:
在現今視訊市場多標準共存的情況下,如何實現消費類電子產品對於視訊應用的支援成為處理器引擎需要面臨的挑戰。

隨著消費類電子產品(手機、PDA、PMP)市場的急劇發展,消費者對於多媒體(主要表現在視訊應用上)應用的需求日漸增強。對於供應商來說,這意味著一個或者兩個多媒體編解碼器已經遠遠不夠。尤其在現今視訊市場多標準共存的情況下,如何實現消費類電子產品對於視訊應用的支援成為處理器引擎需要面臨的挑戰。

實現視訊解碼通常有3種方法:其一,用RISC CPU與RTL加速器;其二RISC CPU+DSP引擎+RTL加速器;其三,可配置型處理器。在這3個方案裏面,前面兩者是目前市場上普遍應用的方法,然而通用CPU巨大的功耗與面積問題讓可攜式視訊應用舉步維艱,而RTL加速器雖然在處理速度上頗具優勢,然而隨著標準數量的增加,RTL模組的數量以及複雜度也直線上升,另外,無論升級或者修改矽晶片都需要重制。因此,以可編程性處理器來承擔全部的視訊解碼任務的解決方案在功耗、性能與設計靈活性之間找到了一個合適的平衡點。

正是看中這樣的市場機會,Tensilica公司向全球發佈了4款支援目前主流的視訊編解碼演算法的標準視訊處理器內核——Diamond VDO。與前兩種方法不同的是,可配置視訊處理器有機會調整DSP功能,以適應現實中各種視訊處理標準的改變。Tensilica可擴展的視訊引擎處理器不需要大功耗CPU,佔用空間面積同時縮小,編解碼任務可由視訊處理器完成,從而將CPU從大功耗與過多的任務處理中解脫出來。而傳統方法中主機處理器和解碼器間過多的通信所引起的匯流排傳輸功耗,亦因為可配置視訊處理器可以利用CPU定制的內部資料通道上傳輸完成,從而節省了功耗。

圖1:Tensilica Diamond VDO視訊處理引擎


Tensilica公司行動多媒體方案市場總監Larry Przywara詳細講解了Diamond VDO系列的架構。得益於Xtensa可配置處理器技術,Diamond VDO採用雙處理器的架構,包括一個集成DMA引擎,能以極低時鐘速率實現完整D1 Main profile的解碼和ASP編碼(完整的H.264 Main profile解碼僅需172MHz,而MPEG-4 Advanced Simple Profile(ASP)的解碼僅需156MHz)。Diamond VDO雙核架構包括基於Xtensa架構配置得到的一個流處理器和一個圖元處理器。流處理器指令集對視訊資料(熵解碼、運動向量的預測等等)的串列式處理進行了優化。圖元處理器指令集採用SIMD(單指令多資料)技術,對圖元資料的並行式處理進行了優化。Diamond VDO還定義了400多條視訊專用指令(其中包括了CABAC、CAVLC、Deblocking、Transforms、運動補償和運動估計等)來對視訊資料串列式處理進行優化。

Larry談到之所以特別強調Diamond VDO對於CABAC的支持是因為,目前市場上的解決方案裏面都忽略了對CABAC功能的支持,通常採用獨立的複雜的且不可擴展升級的RTL加速模組,或者是以更高頻率的通用型CPU來實現。這明顯增加了系統設計的複雜度以及功耗。Tensilica是第一家採用純軟體方案(指令集擴展的方式)實現CABAC視訊解決方案的。這樣做最明顯的好處當然是降低了整體的功耗以及面積。Larry解釋道,“因為傳統的解決方案當中,資料通過匯流排在CPU與加速器之間傳輸時是會產生大量的功耗的——這部分功耗卻往往被廠商忽略。而Diamond VDO因為採用擴展處理器的指令集的優化方式,因此省卻了頻繁的匯流排傳輸。這是降低功耗的一個關鍵所在。另外一點就是,當Diamond VDO引擎沒有用於視訊處理的時候,它可以被當作一個相當於500 MIPS的通用型處理器來執行其他系統任務。相對應的,傳統的RTL模組則無法做到這樣的可重用性。”

圖2:Tensilica xtensa LX2可配置處理器


由於消費者的需求擴展了消費類設備中ASIC的技術規格要求,越來越多的應用將通過使用可配置處理器來執行。借助於可配置處理器所帶來的自動設計流程,新的功能支援將會像軟體升級一樣簡單,而設計和驗證時間也將大大降低。

電子郵件:look@compotechasia.com

聯繫電話:886-2-27201789       分機請撥:11