一、前言
2010年乍始,從阿凡達電影的熱賣,為3D TV的問世鋪了風光之路,隨著業者積極拓展家用3D顯示介面進入消費市場,人類的視覺經驗從2D進入3D多媒體世代。而在互動方式上,主要決定於運算技術來做區別,Remote Control與Touch Panel的運算方式為2D(只捕捉目標的空間位置,即x 軸與 y 軸),而Motion Tracking技術,假使除了捕捉目標的空間位置(X 軸和 Y 軸)和顏色之外,還能捕捉目標的深度(又稱 Z 軸)、範圍、距離及其周圍環境的話,即被稱為3D運算方式。因此互動的方式從過去的以滑鼠、搖桿的2D運算方式,進展至將更人性化的3D互動運算世代,從微軟新一代的Kinect遊戲機,見證了以全身動作來進行互動遊戲的操控新境界,隨著3D運算控制的應用逐漸擴大,預期廠商將更進一步將此類技術導入一般人的日常生活。
二、從家用遊戲看感測技術的變遷
不論是從1980年代到1990年代的搖桿加手把,或是2006年任天堂所推出的手把加上感測器的方式,乃至於現今Microsoft採用Sensor加上語音控制所推出的Kinect,我們都可以發現,遊戲業者不斷改進的之處即是「人與機器之間的互動」,而與機器之間互動的技術重點即在於「Tracking」。Tracking技術的主要目的是即時跟蹤和回饋目標的位置和方向,在終端做出相對應顯示變化,即目標在三維空間的具體位置和它所面對的方向。
但是即使是Wiimote手把的Tracking方式,因為在定位的方式上缺乏深度(Z軸)的資訊,故其運算控制的方式仍屬於2D的形式,同時使用者仍須手持手把才能進行定位,因此也讓後繼的業者開始思考「如果可以擺脫手把等裝置」,以便讓使用者能夠更自由的與機器互動的可能性,EyeToy 便是在這樣的思維下所開發出的另一種產品。Sony在2003年首度發表應用於PS2的EyeToy,它是一種color digital camera取像裝置,類似於webcam。EyeToy實現了讓玩家以身體動作變化、color detection以及聲音辨識來和遊戲互動。
而2011年Microsoft所推出的Kinect,其感測技術則與過去有所不同,Kinect使用了CMOS感測器,透過黑白光譜的方式以每秒30幅的速度生成景深圖像流,這樣的方式不需使用者外加其他的感測裝置,便能夠讓主機即時以3D運算再現周圍環境,取得被測物的深度資訊,進而追蹤位置。
資料來源:各公司;工研院IEK ITIS計畫(2011/10)
圖1 感知方式與運算方式的演進
三、2D顯示技術結合3D運算控制技術的產品應用發展
1. 遊戲
2010年Microsoft運用3D互動運算技術,在自有遊戲機Xbox 360上配置深度影像感測模組,只需將Kinect連接至Xbox 360之後,不需在身上額外配戴任何裝置,就可以站在螢幕前面直接與遊戲中的人物互動,玩家全身所有動作都能夠真實地反應在遊戲當中。
這是3D運算控制技術首次進入到家用領域,過去這樣的技術一直是使用於軍事用途,一般消費者很難想像這樣的技術也能應用於遊戲的應用。但是隨著Kinect的熱銷,再加上有越來越多的遊戲軟體在內容上的強力支援,3D運算控制技術在家用遊戲領域的地位已然宣告確立。
2. 結合Internet TV-與網路上的社群互動
近年來社群網站的興起,「即時與網路上的好友互動」已成為時下最熱門的網路活動,再加上網路頻寬的擴大,越來越多人熱中於「分享」的快樂,不論是文字或是圖像,乃至於動畫影像,無一不增添人際之間互動的娛樂性。Kinect推出之後,Microsoft不斷延伸對3D運算控制技術的應用領域,其中最值得關注的即是結合3D運算控制技術與網路社群交流的機制。依據Microsoft已發表的資訊,該公司計畫推出「Avatar Kinect」的服務,Avatar Kinect是一個運用在Xbox Live環境下的聊天室,玩家們所做的臉部表情,甚至手勢動作都會如實的反應在虛擬人偶上,如臨現場對話,生動而饒富趣味。透過3D運算控制技術的支援,Kinect能夠捕捉、描繪玩家眼睛、包括眉毛以及嘴巴附近的動作變化,據此偵測出玩家臉部表情變化,另外上半身動作也可以感應到,將這些資料運算後立刻半即時反應到玩家的Avatar。
3. 結合Internet TV-控制電視畫面上的選項
現在我們所熟知現在的電視,使用者幾乎是被動的接收資訊,與電視的互動僅止於「觀看」的動作,而這樣的互動形勢所呈現的介面相對簡易,畫面資訊簡要而不複雜,因此在控制上,使用一般遙控器即能輕鬆操控電視。
但隨著傳播方式的演進,電視數位化的腳步逐漸加快,再加上網路頻寬與日遽增,使得整體系統容許電視訊號在單位時間內能傳輸的資訊量大增。正由於傳播型態的改變,另一種新型態的電視產品-Internet TV便悄然進入我們的日常生活當中。因為Internet TV提供多樣化的資訊選擇,同時允許雙向互動的機制,因此使用者開始可以成為主動選擇資訊的角色,而當可供選擇的功能增加時,有時要從畫面上的多個影像中選出想要觀看的影像。這時3D運算控制應用所提供的手勢辨識的功能,在使用上的便利性相較於遙控器要來的方便許多,而且也更為直覺,成為未來電視畫面控制的另一種可能的選擇。
四、IEK觀點
未來3~5年內,3D運算控制技術結合顯示器的發展趨勢進行總結。首先在產品應用的部分,2D的顯示器技術發展已臻成熟,未來業者在產品設計上將以多樣化功能,並且提供更多元的內容服務,除吸引消費者青睞外,也提昇產品的附加價值。而在互動運算控制技術上,2D的運算方式已為消費大眾所熟悉,而3D互動運算控制藉由Kinect等產品的銷售,讓一般消費市場體驗到非接觸式互動方式的便利性與直覺性,使得業者不斷進行創新應用的研發,而這也將是下一步市場關注與業者積極投入研究的潛力技術。因此在結合「觀看」與「控制」兩項要素來觀察未來的系統設計上,未來3~5年內預計在技術與產品開發上將會以2D影像結合3D運算控制技術為主進行發展。
以2D影像結合3D運算控制技術的應用發展,其中之一即是Internet TV的逐步進入消費市場將帶動家用3D運算控制技術進一步普及。其可能的應用型態為遊戲、網路社群互動應用,以及畫面選項控制等。而可能搭配使用的硬體系統則將以PC與TV做為應用產品,結合3D運算控制模組,建構家庭當中非接觸式的人機互動介面。而此類應用所需求的技術將以手勢辨識以及臉部辨識為重點,除了能夠控制畫面中的選項之外,也提供娛樂性更高的互動方式。