要實現自主,機器人不僅僅只需要人工智慧(AI),還需要很多感測器、感測器融合以及邊緣即時推理。由於深度卷積神經網路的優點已得到公認,雷射雷達對更為先進的資料處理的需求正在把神經網路推向新的拓撲結構,以實現自主。
第一個機器人在20世紀50年代末、60年代初誕生,但嚴格意義上它不算機器人,只是一台“可程式設計的物品傳送設備”,它被用於移動通用汽車公司生產線上壓鑄機周圍的產品。1954年專利的第一句話強調了本發明的可程式設計性和通用性,並且表明可程式設計性要求感測器確保程式、期望軌跡或功能和實際運動之間的一致性。
時至今日,機器人並沒有完全偏離最初的概念:如今的機器人是可以進行程式設計的。它們需要感知自身的環境,以確保所做的事情和被設定要做的事情是一致的。而且,它們需要在自身的環境中移動。過去50-60年來所發生的變化主要是在複雜性、速度以及應用這些基本概念的領域方面有所增加。
雖然第一批機器人主要用來移動壓鑄件,但機器人之父約瑟夫·恩格爾伯格(Joseph Engelberger)深受阿西莫夫機器人第一定律的影響——機器人不得傷害人類,或看到人類受到傷害而袖手旁觀。他把機器人部署在可以保護人類的地方。保護人類也是感測器數量不斷增加的驅動力,特別是在協作機器人(cobots)或自動導引車(AGVs)中。
是什麼推動著機器人產業的發展?
為了更好地理解對自主機器人的追求,讓我們回顧一下Alex Wissner-Gross的“智慧定律”方程式:它是一種熵力,解釋了機器人學的發展趨勢:
F = T ∇ Sτ (1)
其中F指的是使未來行動自由最大化的力,T指的是定義整體強度的溫度(可用資源),以及S指的是時間範圍tau內的熵。
機器人學作為一門工業和科學,其目標是通過增加嵌入式模擬智慧來最大限度地提高未來機器人行動的自由度。這就需要:
有更多的感測器來獲得更高精度的機器人周圍環境模型。
有更好的感測器連接到控制演算法(和更分散的控制演算法)。
有更好的演算法從感測器資料中提取盡可能多的資訊。
有更好的執行器來根據控制演算法的決策更快更準確地行動。
不妨看一看當今的科技領域,機器人已經獲得了很大的自主性,並且正在使用來自互補性氧化金屬半導體相機感測器、雷射雷達和雷達的感測器來適應各種各樣的應用。雖然相機的角度解析度和動態範圍比雷達大得多,但相機不能提供雷射雷達所具有的動態範圍,也不能在煙霧彌漫或多塵的環境中工作。
圖1:工廠環境中的現代機械臂示例。
由於機器人被設計成適應最廣泛應用的最靈活的選擇,因而它們需要在低光、多塵或明亮的環境中工作。這種靈活性可以通過組合感測器資訊——aka、感測器融合來實現。換句話說,不同感測器的資訊可用于重建機器人環境的彈性表示,從而在更多應用中實現自主性。例如,如果一個相機被暫時覆蓋,則其他感測器必須能夠使機器人安全運行。為確保機器人能對其所處環境有全方位的瞭解,機器人感測器資料需要以限時的方式進行路由,並用少量的電纜連線到機器人控制器,以最大限度地提高連接的可靠性。
如今,高頻寬低延遲匯流排主要基於低壓差分信號(LVDS)。然而, LVDS介面並沒有標準,這就導致感測器到控制器的生態系統出現分裂,並且使來自不同供應商的混合和匹配解決方案變得困難。一旦感測器資料被傳輸到機器人控制器,一系列基於深度神經網路的機器學習演算法可以説明提高機器人所處環境的精度。用深度學習教父Yann LeCun、Yoshua Bengio和Geoffrey Hinton的話說,“深度學習允許由多個處理層組成的計算模型學習具有多個抽象層的資料表示。”這些深度神經網路可以在機器人內部用於快速、即時處理,也可以在雲中用於元資訊收集或更複雜的推理。
圖2:機器人的不同感應能力。
對於大多數機器人來說,得益於邊緣處理所允許的固有低延遲,邊緣推理是確保機器人能夠對其環境的變化做出快速反應的重要參數。邊緣推理可用於卷積神經網路,類似的神經網路拓撲結構可用於圖像分類或預防性維護估算,深度Q網路可用于機器人路徑規劃,或用於為解決一類特定問題而設計的自訂神經網路。
展望未來
在未來,感測器似乎不太可能有太大的變化,但所涉及的處理將有所不同。成像感測器可能變成高光譜或可提供更高的解析度。雷射雷達可能有更高的波長、更安全、並具有更長的範圍。雷達感測器可能配備集成天線,但這些並不會有顯著變化。未來將改變的是資訊使用和聚合的方式。
例如,在感測器集線器上,引入單對乙太網(aka T1)和資料線供電(電氣和電子工程師學會802.3bu-2016)將簡化感測器集線器介面的設計,從而使更感測器組合更廣泛和實現標準化配電。在控制方面,強化學習將由於最近的突破而得到加強,從而解決了諸如從所有可能的失敗中學到的高成本,以及由於學習模式的偏斜而學習錯誤行為的懲罰等難題。
在歸類方面,大多數基於卷積神經網路的方法並沒有從雷射雷達提供的體素中完全提取出所有的3D資訊。下一代深度神經網路將利用框架提供的非歐幾裡德機器學習(或幾何機器學習)中的最新進展,如PointNet、ShapeNet、Splatnet和Voxnet等框架。邊緣推理和感測器融合將融合到我所看到的多個感測器源的層次推理中。在這裡,資料將通過更簡單的推理網路做出更快的回路反應,例如電流控制神經網路,以改善現有比例-積分-微分網路的性能,一直到能夠提供預測性維護診斷並處於中間位置的更加複雜的長期-短期記憶網路。神經網路將能夠補償機器人結構的微小誤差,並提供更高的位置精度和更平滑的運動。
總結
自主機器人進化是一個始終變化的目標。當喬治·德沃爾(George Devol)在1954年申請專利時,此機器顯然比當時任何基於凸輪或人工作業的機器都更自主。但按照今天的標準,這將是一個非常僵化的設置,甚至不會出現在自主程度的排名上。這種劇烈的變化很可能在我們意識到之前再次發生。
現在人們認為,輪式機器人和協作機器人正處於自主的邊緣,當人類靠近它們時,它們會減速,甚至在移動時也能避免撞到人類。隨著嵌入式模擬智慧技術的迅速變化,這些“處於邊緣”的創新型機器人在不久的將來不會被視為具有自主性,因為這個行業正在以如此之快的速度發展並不斷產生新技術,從而使得機器人技術比以往任何時候都更加自主。