2010年9月30日星期四

Nuance展示語音辨識技術

提及語音辨識技術(Speech Recognition Technology)的實際應用,最常聯想到的,莫過於讓使用者以語音方式,轉接到適當分機電話的語音總機系統、語言教材軟件,又或是互動玩具應用等。事實上,語音辨識技術在默寫記錄,及搜尋檢索目錄文檔方面亦發展成熟,在歐美等地均廣被採用。

事實上,語音辨識技術的應用範疇之廣,遠超一般人的認知。以Nuance通訊為例,即結合了語音和智能文字輸入技術,每年自動處理逾九十億次互動電話客戶服務來電,並已為超過二億五千萬台流動設備提供語音技術。Nuance更分別為全球五大手機生產商、前十大汽車製造商、十大個人導航設備生產商、逾三千家醫院,及三分之二Fortune百大企業提供解決方案。其主要業務可分為三大範疇:客戶服務中心(Contact Center)、流動應用,及認知服務(cognitive service)。

小題:語音速記助醫生律師作文字記錄

Nuance亞太區高級副總裁Jason Stirling表示,除了最廣為人熟悉的客戶服務中心語音辨識方案,默寫記錄及搜尋檢索目錄文檔方面,在醫療界及法律界等專門行業亦被廣泛採納。

「在美國有法規要求醫院保存一切治療及手術的文字記錄。行內有個笑話,指醫生的筆跡猶如草書,內容肉眼難辨,有了Nuance的默寫功能,醫生即可唸讀出詳細記錄,由語音速記解決方案代為準確輸入文字記錄,完成報告。事實上,像醫生及律師這等專業人士,每天須處理的個案繁多,若要求他們在診證手術後,或案件審理完畢再伏案書寫文字記錄,那是浪費他們的時間,對醫院或企業而言亦是資源錯配。」

若以比例進行比較,Nuance的語音速記解決方案,比99%人工打字輸入速度還要快,更可避免人為手誤。

語言支援照顧口音異同

當然,不少人會關注口音迥異及語言支援方面的問題。就此,Nuance通訊公司企業部產品副總裁Dan Faulkner表示Nuance的語音辨識技術可支援多達五十九種語言,以中文速記為例,即可分別輸入繁或簡體中文,亦可成功辨識中國及台灣的普通話之別,更可支援廣東話;英文方面,則可支援英、美、澳洲及印度口音。

「我們的研發團隊內有多位語音科學家,長期針對鑽研不同國家的口音異同。以客戶服務中心為例,除了按該中心的地區決定主要的語言支援外,英、美兩地的英語近似,口音雖有細微分別,但支援上絕不成問題,語音總機系統仍會順利將電話轉駁至正確的分機電話。」

以聲紋作生物認證

如同指紋一樣,每個人的聲音均有其獨一無二的聲紋。而比對分析聲音的生物認證技術(Biometric Identification),在歐美等地早為金融及政府機構採用。

傳統基本安全認證如個人帳號及密碼被盜用時有所聞,根本不足以確保電子商務和網絡交易的安全性。Stirling指出,一次性密碼雖廣泛應用於網上交易,惟電話理財則不受保障,因此聲紋比對生物認證技術即大派用場。此認證技術的優點,為偽造及破解相當困難,加上使用方便,不必擔心遺失或損壞。

雖然現階段本港尚未有銀行採用Nuance的聲音認證技術,但Stirling對大中華區市場前景感樂觀。Nuance早前便公布與Flaircomm合作,於Nuance語音辨識引擎VoCon 3200上開發新一代車載藍牙及多媒體系列產品,結合藍牙、3GWifi等無線技術,以實現無縫的車載語音體驗。目前,Nuance VoCon 3200不僅可借助簡單語音指令操控電話撥打和導航終端進入,更可支援如曲目篩選等較複雜的動態目錄功能。

沒有留言:

發佈留言