當前位置: 主頁 > 新聞 >
 

NVIDIA 在語音人工智慧的突破性研究成果 讓企業能夠為每個品牌創造獨一無二的聲音

本文作者:NVIDIA       點擊: 2021-11-11 17:27
前言:
NVIDIA Riva Custom Voice 軟體可用於支援虛擬助理、客服中心語音及 其它語音應用程式;Riva Enterprise 版本可用於大規模部署
NVIDIA (輝達) 宣布推出一款工具,只要透過 30 分鐘的音訊資料,便能在短短一天內量身打造出宛如真人的聲音。

NVIDIA Riva 語音人工智慧 (AI) 軟體裡的 NVIDIA Riva Custom Voice 功能,讓數百萬間公司能在數小時內,僅透過少量資料就能以 Riva 開發出的量身打造的生動語音內容。

企業可以使用 Riva Custom Voice 打造一個擁有獨特聲音的虛擬助理,客服中心可以用以快速開發易於辨識的品牌聲音以服務客戶;而開發人員則能用它來建立多種應用程式,以協助有言語表達及語言障礙者。

NVIDIA AI 軟體產品管理部門副總裁 Kari Briski 表示:「真人般的互動始終是 AI 領域最大的挑戰之一,尤其對使用特定行話的產業來說更是如此。現在這些公司可以使用語音 AI,以品牌獨特又生動聲音來傾聽及回應客戶,有助於促進更具吸引力和更愉悅的互動。」

圖_ NVIDIA Riva SDK 包括世界級的自動語音辨識及文字轉語音功能,可以根據不同口音和領域客製化。

Riva Custom Voice 可在最新版本的 NVIDIA Riva 語音 AI 軟體開發套件中取得。Riva SDK 包括世界級的自動語音辨識及文字轉語音功能,可以根據不同口音和領域客製化,還能將語音服務擴展到雲端、資料中心或邊緣的數十萬個串流內容。

語音技術產業生態系
NVIDIA 的對話式 AI 軟體在不到三年的時間已經超過 25 萬次下載,在多個產業中被廣泛採用。

全球企業雲端通訊、視訊會議、協同合作及客服中心解決方案的頂尖服務供應商 RingCentral,將 Riva 自動語音辨識技術用於該公司視訊會議的即時字幕功能,提高與會者的參與度。

RingCentral 執行副總裁暨產品與工程部門總經理 Nat Natarajan 表示:「我們的目標是打造更智慧的會議,在 NVIDIA Riva 的助力下,現在就能在 NVIDIA GPU 上訓練即時轉錄模型,提高辨識各種口音的準確性。我們預計將於日後推出多個同時進行的串流內容,而 Riva 可以輕鬆擴展,在不到 300 毫秒的時間內,就能即時處理這些串流內容。我們很高興能與 NVIDIA 合作,共同發展更美好的未來。」

全球最大的金融服務集團之一中國平安也正使用虛擬助理,縮短等待時間以改善客戶體驗。該集團使用 Riva 打造即時語音應用程式,而這些應用程式的準確性不斷提高。

中國平安首席科學家肖京表示:「中國平安利用聊天機器人助理,每天處理數百萬筆客戶查詢內容。使用 NVIDIA 預先訓練好的自動語音辨識模型,再用我們的資料進一步進行微調,系統準確率提升了 5%,讓我們能提供更吸引人及更可靠的服務。」

數十個軟體開發商也在生產環境中使用 NVIDIA 的對話式 AI。Gosoft Contact Center 與擁有超過 20 個業務領域的 CP All 合作,其零售領域為泰國超過一萬間 7-11 便利商店提供服務。透過使用泰語訓練出的高準確度 AI 語音機器人的協助下,每天能處理多達 24 萬通電話。

 
Plabook Education 與 Data Monsters 正在與美國各地學區合作,透過該公司的 AI 數位虛擬化身閱讀小幫手,找出發音錯誤的單字及衡量閱讀的準確性,幫助兒童學習閱讀。

供貨時程與定價
進行小規模研發的單位可以在 NVIDIA NGC 容器登錄免費取得 NVIDIA Riva。開發人員可以參加 Riva 公開測試計畫並立即試用,以及接受 NVIDIA 即將推出的功能通知。

需要進行大規模部署且希望獲得 NVIDIA 專家技術支援的客戶,NVIDIA 亦宣布預計將於明年初推出 NVIDIA Riva Enterprise 計畫。

Riva 在 GTC 大會
NVIDIA 創辦人暨執行長黃仁勳在 GTC 主題演講中展示了 Riva 的語音 AI 功能,包括在 Riva Custom Voice 的展示中,如何只用 30 分鐘的資料,就能創造出跟真人一樣的語音內容。

另外,透過 Project Tokkio、DRIVE Concierge 和 Project Maxine,也能看到 Riva 被運用在製作互動式虛擬化身的 Omniverse Avatar 平台。Project Tokkio 與 DRIVE Concierge 展示了用於客服和車內環境中的虛擬化身,而 Project Maxine 則強調多種語言間的即時翻譯和文字轉錄功能。

本次 GTC 規劃了超過 20 場對話式 AI 的演講,包括來自 Hugging Face、Snap、T-Mobile 等公司的專家演講。主題涵蓋用以開發與整合 GPU 加速語音和語言 AI 應用程式所使用最先進的演算法、工具、面臨的難題及其影響。

免費報名參加 NVIDIA GTC,以瞭解更多關於 NVIDIA Riva 的資訊,線上 GTC 將舉行至 11 月 11 日。敬請觀看 NVIDIA 創辦人暨執行長黃仁勳於 11 月 9 日發表的主題演講。
 

電子郵件:look@compotechasia.com

聯繫電話:886-2-27201789       分機請撥:11