得益於大資料的興起和計算能力的快速提升,機器學習技術近年來經歷了革命性的發展。諸如圖像分類、語音辨識和自然語言處理等機器學習任務,都是對具有一定大小、維度和有序排列的歐幾裡得資料進行處理。然而,在許多現實場景中,資料是由複雜的非歐幾裡得資料 ( 例如圖形 ) 表示的。這些圖形不僅包含資料,還包含資料之間的依賴關係,例如社交網路、蛋白質分子結構、電子商務平臺中的客戶資料等。資料複雜性的提升給傳統的機器學習演算法設計及其實現技術帶來了嚴峻的挑戰。在這種情況下,許多全新的基於圖形的機器學習演算法或圖神經網路(GNN)不斷在學術界和工業界湧現。
GNN 對計算能力和存儲有非常高的要求,而且其演算法的軟體實現效率非常低。因此,業界對GNN 的硬體加速有著非常迫切的需求。儘管傳統的卷積神經網路 (CNN) 硬體加速有很多種解決方案,但 GNN 的硬體加速還沒有得到充分的討論和研究。在撰寫本白皮書時,谷歌 (Google) 和百度 (Baidu)都無法搜索到關於 GNN 硬體加速的中文研究資料。本白皮書的寫作動機是將國外最新的 GNN 演算法、對加速技術的研究以及對基於現場可程式設計邏輯閘陣列 (FPGA) 的 GNN 加速技術的探討相結合,並以概述的形式呈現給讀者。
圖 1:典型的 GNN 架構