語言障礙者Aubrie Lee點餐時,已經能透過語音轉語音的技術,由App正確覆述她的餐點內容,以便讓店員理解。

圖片來源: 

圖/Google

全球有數百萬人受到中風、漸凍症、腦性麻痺、腦部創傷或帕金森氏症等病症影響,無法發音正確且流暢的說話,導致說出來的話難以被他人理解。Google正在測試一款Android應用程式稱為Relate,旨在協助語言障礙人士,讓他們更輕鬆地和他人溝通,並能與Google語音助理互動。近日也徵求來自澳洲、加拿大、紐西蘭和美國的英語測試人員,來進行Beta版測試。 

Relate計畫從2018年展開,試圖以語音辨識的技術,來改善語言障礙者說話難被理解的處境。Google AI部門產品經理Julie Cattiau指出,一般的語音識別技術,在缺乏非典型語料作為訓練資料的情況下,無法辨識這類說話型態,所以Google語音與研究團隊數年來召集語言障礙者參與研究,錄製特殊語音樣本,目前已經累積超過數百萬筆特殊語料,來訓練非典型語音辨識模型。

參與這項計畫的其中一位語言障礙人士,就是Google的品牌經理Aubrie Lee,同時是Google身心障礙員工資源小組的主席,她患有肌肉萎縮症,導致語言能力受到影響。但從Google釋出的影片可以看到,這款App已經能在Aubrie Lee點餐時,正確覆述她的餐點內容,以便讓店員更容易理解她的意思。她也因此為App命名為Relate(訴說)。

Relate涵蓋三大功能:聆聽、覆述、啟用Google助理

Google整合了核心語音識別模型與多項既有技術,開發了Relate應用程式。這款App涵蓋三大功能。其一,是最核心的語音轉文字功能(Speech-to-text),讓使用者先錄製約250~500組語音詞彙,由AI引擎自動學習並訓練出個人化的語音識別模型,來正確瞭解使用者獨特的說話方式,並將語音轉譯為文字。

Julie Cattiau表示,錄製500組詞彙大約需要30~90分鐘不等,但若錄製了250組詞彙後,模型準確度已經達到一定標準,則會提前釋出模型來應用,「這取決於語言障礙者本身語態可被理解的程度。」

而這些需要預錄製的詞彙,也非使用者隨機挑選,團隊會從日常用語及Google語音助理常用詞彙中彙整,再要求使用者錄製。因此,這款App並不一定適用所有場景,比如使用者說出「mathematics(數學)」這個詞彙時,App不一定能辨識出來,但使用者可以自行建立個人化的詞彙,比如家人朋友的名字、特殊常用詞彙等,擴大App可識別的詞彙範圍。「新增App需求之外的詞彙,也能讓模型變得更加堅固(robust)。」Julie Cattiau說。

App的另兩項功能,則是整合了Google本身的相關技術,比如語音合成功能(Text-to-speech),也就是當使用者的特殊語音轉為文字資訊後,App可將文字以清楚的合成語音重新覆述。App還能串接Google語音助理,讓使用者透過App啟動語音助理,來進行開燈、點播歌曲等操作。

之所以將特殊語音識別技術與Google語音助理結合,來啟動多種操作,Julie Cattiau表示,「導致語言障礙的疾病,通常伴隨著行動障礙,對使用者來說,更需要Google Home這類科技工具的輔助。」透過這款App,Google不只要讓語言障礙者更容易與他人溝通,也要讓其生活更加便利。

不過,這款App目前只支援英文,Google還在研究,如何將這項技術擴大應用到其他語言中。


熱門新聞

Advertisement