R&D技術講座 VoIP網路語音技術
本文作者:admin
點擊:
2008-11-24 00:00
前言:
VoIP是Voice over Internet Protocol的縮寫,這是一種透過網際網路或其他使用IP技術的網路,來實現新型的電話通訊方法。VoIP的前身可以追溯到1973年,在ARPANET上的網路語音協定(Network Voice Protocol, NVP)。之後,隨著網路的普及,業界甚至樂觀的預期,VoIP終將完全取代傳統電話服務(Plain Old Telephone Service, POTS)。由現在這個時間點往回看,2001年的網路泡沫依然令人心驚,而POTS的市場雖然逐漸萎縮,然而取而代之的卻未必是VoIP技術,手機成為手持通話方式的更強勁對手,VoIP取代所有手持通話市場的美夢,也許只是網路泡沫的其中之一。
直觀來看,VoIP是POTS在網際網路上的型式移植。一般的家用電話,將語音由發出端送到接收端的過程如下:
l 聲電轉換:通過壓電陶瓷、碳粉等原理做成的拾音器,將聲波變換為電氣信號;
l 傳輸:電氣信號藉由電信業者所架設的公用電話交換網路(Public Switched Telephone Network, PSTN),到達對方的話機;
l 電聲轉換:通過線圈紙盆等原理做成的揚聲器,將電氣信號變換為聲波。
在PSTN中,其實也藉由傳送固定頻率聲波的方式,傳送及接收少量的資料,如電話號碼、狀態音…等。
而VoIP將語音由發出端送到接收端的過程,由於改由網際網路傳輸,因此在傳輸的步驟必須做較多的工作如下:
*聲電轉換:與家用電話一樣;
*量化取樣:由聲波變換而來的電氣信號是類比信號。將類比信號運用類比/數位轉換(A/D Convert)的方式取樣,並遵循某種採樣方法(例如脈衝編碼調變,即PCM)轉換成數位信號;
*封包:將一定時間長度的數位語音信號組合為一幀,然後,按照該VoIP架構所使用的協定,依OSI模型加上各層的表頭和結尾,成為一個完整的封包;
*傳輸:封包藉由網際網路進行封包交換,而傳到對方的話機;
*封包調整:由於在網路傳輸的過程中,封包未必會依發出的順序到達,也未必會在可接受的時間前到達,因此,將封包暫存、排序,並使用一些演算法的技巧來補綴漏掉的封包,便成為VoIP的關鍵技術,通常在網路電話或VoIP閘道器中會有高效能的語音引擎來處理這個繁重的任務。語音引擎的能力越強,使用者聽到的語音越接近真實的語音,聽不出延遲(Latency)與抖動(Jitter),對網路頻寬的要求也越低;
*解封包:按照該VoIP架構所使用的協定,依OSI模型將各層的表頭和結尾剝除,成為一定時間長度的數位語音信號;
*電聲轉換:與家用電話一樣。
語音編碼方法攸關語音品質及使用頻寬,而兩者往往互相矛盾。由於對兩者的取捨有別,而且演算法的影響極大,因此編碼方案五花八門,其中包括國際電信聯盟的G.711(速率64kbps),G.723.1(速率5.3kbps或者6.3kbps),G.729A(速率8kbps)編碼方案。微軟、Intel、Skype等業界巨頭也有自己的編碼方案。不幸的是,使用不同編碼方法的話機不能互通,演算法又常常因為專利的問題而另行收費,對網路電話的互通造成很大的影響。
常用的VoIP網路協定
用於VoIP的網路協定,目前常用的則有H.323、SIP、Megaco和MGCP。
H.323是由ITU-T於1996年提出,原本是用於區域網路(LAN)上的視訊會議,後來被應用於VoIP網路電話上。H.323定義了一個綜合性的規範,使網路上的終端設備遵循這些規範,得以順利進行溝通,包括語音壓縮格式(G.711、G.729、G.723.1)、影像壓縮格式( H.261、H.263 )、呼叫(H.225)、控制(H.245)、註冊與認證等。H.323架構由4個元件所組成,包括終端設備(Terminal)、閘道器(Gateway)、閘道管理員(Gatekeeper)、多點控制單元(MCU:Multipoint Control Unit),可進行單點對單點或單點對多點的通訊。
對於VoIP的應用而言,H.323的子協定多且複雜性高,在許多技術上的問題受限,不容易針對新的應用作擴展。因此,IETF(Internet Engineering Task Force)分別在1999年8月提出MGCP(Media Gateway Control Protocol)協定,1999年3月提出SIP(Session Initiation Protocol)協議,試圖簡化H.323的複雜性,且在語音傳遞功能提供較高的延展性。
SIP是一種應用層控制協議,用於和一個或多個參與者建立、修改和終止會話。 SIP 的結構與 HTTP相似,客戶機發出請求,並發送給伺服器,伺服器處理這些請求後給客戶機回送一個響應。請求與響應形成一次交換(transaction)。
MGCP是由Cisco和Telcordia提議的VoIP協議,它定義了呼叫控制單元(呼叫代理或媒體閘道器)與電話閘道器之間的通信服務。MGCP屬於控制協議,允許中心控制台監測IP電話和閘道器事件,並通知它們發送內容至指定地址。在MGCP結構中,智能呼叫控制置於閘道器外部並由呼叫控制單元(呼叫代理)來處理。同時呼叫控制單元互相保持同步,發送一致的命令給閘道器。
Megaco(又為H.248)是一種控制協定,用來在網路上做媒體閘道器與媒體閘道控制器之間的控制。 Megaco/H.248定義媒體閘道控制器所用的控制機制,以控制閘道器特別可以支援網路上的多媒體資訊流。從 VoIP 結構和閘道器控制的關係來看, Megaco/H.248 與 MGCP 在本質上相當相似,但是 Megaco/H.248 支持更廣泛的網路媒介,如 ATM 。
同樣不幸的是,使用不同VoIP協定的話機也不能互通,更甚之,由於有些協議(如SIP)並不是硬梆梆的規格,而有「協議」的性質,細節的實作也往往因廠商而有不同,使網路電話的互通更加困難。
節費為主要應用誘因
在VoIP電話興起的年代,推廣者的訴求重點中一定會提到「節費」二字,這在當時是非常吸引人的訴求。然而回首往事,這個訴求恰恰是VoIP取代所有手持通話市場的最大障礙。原來世界各國的電信事業,不是國有企業、特許行業,就是托拉斯級的巨獸型企業,在這些企業花費鉅資,布建了廣大的PSTN網之後,突然有新的技術以「節費」為訴求,居然可以坐享其成(不要忘了,網路的最後一哩常常也是借道PSTN),電信業者情何以堪?因此,VoIP電話在各國,除了日本勉強可以推動050網路電話之外,其他國家都受到技術性的阻撓,如無法監聽、無法緊急撥號…等。因此,網路電話總是無法成為主要的手持通話裝置。
在網路泡沫化之後,VoIP的話題沈寂了一段時間,直到2003年,Skype的問世,吸引了眾人的目光。清晰的語音與囊括所有網路電話優點的使用界面,使Skype一夕之間成為網路電話的代名詞,使用VoIP技術通話的人口也因此激增。然而,對於手持式VoIP電話系統而言,這顯然是重重一擊,因為類似Skype這類即時通訊軟體不需太多額外成本,不像手持式VoIP電話需另行購置話機,VoIP取代所有手持通話市場的可能性更加降低。
跨國企業成為主要客群
儘管如此,由於全球化的影響,跨國企業越來越多。分布在世界各地的企業分部及工廠需要有更經濟實用的電話系統,對於同時有能力提供語音交換及網路裝置建置的廠商,如Cisco、Avaya、Nortel…等,則是一大商機。建構良好的VoIP系統,不但能共用傳送資料流的網路連接,而且使用方便,甚至使用公司內部分機號碼就可以和遠在他國的單位通話。
同時,經過這麼多年的技術發展,VoIP交換技術也很成熟。因此,有些以往費用較昂貴的長途電話及國際電話,也有不少例子是除了原來的衛星連線、海底電纜連線外,也提供以VoIP為媒介的連線。有些規模較小的電信業者,也使用VoIP交換技術,以租用短途電話線路(價位較便宜),長途部分則以VoIP做為媒介的方式,既賺取差價,也不會明白得罪主要的電信業者。
目前,VoIP交換技術幾乎都掌握在VoIP設備大廠手裡,但是一般人所不清楚的是,那些美美的、可靠的話機、高速價昂的VoIP閘道器…等設備的製造,卻有一大部分是由國內的網通大廠,如鴻海、明泰、華碩、緯創、東訊、英保達等代工。
VoIP將無所不在
VoIP逐漸從光芒萬丈的第一線,慢慢淡出到平實的第二線,在技術的領域裡,歷史一再告訴我們,如何能在變動較小的情況下,結合現有勢力,是成功的捷徑之一。處理器是如此,VoIP也是如此。畢竟好的技術總是不寂寞,只不過是「轉進」而已。隨著晶片的計算能力突飛猛進,VoIP漸漸成為一種通信的基礎技術,以後,你總是可以在各種不同的通信方法中看到它的實作──或是影子。