在本周開發者大會re:Mars上,Alexa資深副總裁暨首席科學家Rohit Prasad展示Alexa開發中的技術,號稱可以在聽取不到1分鐘的聲音錄音後,模仿出任何「高品質」的聲音,而不必再像以前花大量時間來後製。

本周在拉斯維加斯舉行的開發者大會re:Mars上,Amazon高層透露AI語音助理技術Alexa的研發進度,包括可模擬任何人的聲音,例如用已過世祖母的聲音為小男孩講床邊故事。

在實體開發者大會的開幕演說上,Alexa資深副總裁暨首席科學家Rohit Prasad展示Alexa的最新開發成果。他展示的一則影片中,一名小男孩在床邊故事時間對Amazon Echo智慧喇叭中的Alexa問能不能讓祖母為他講完《綠野仙蹤》(The Wizard of Oz)。影片中,Alexa即以這位已在天上的祖母聲音,開始講故事。

Prasad指出,這是Alexa開發中的技術,號稱可以在聽取不到1分鐘的聲音錄音後,模仿出任何「高品質」的聲音,而不必再像以前花大量時間來後製。他說過去二年許多人的親人在疫情中離世,Amazon這項技術旨在保留對親人的回憶。

 

 

Prasad說Alexa的祕訣在於把它當成語音轉換,而非語音合成的任務來解決。Amazon並未進一步提供細節,也不願說明這項技術何時會問世。

Amazon同時還展示可清楚與訂餐廳的消費者互動的AI助理。

在AWS的部落格文章中,Prasad說明在Re:Mars大會上展示的可概括化AI(Generalizable Intelligence,GI),這類AI並非全知全能,而是更實用的AI技術,具有3種特點,包括能完成多種任務、能快速適應多變環境,以及利用很少的人力輸入即可學習新概念和行為,基本上就是人類學習新事物和生存的方法。

雖然能讓已逝的親人的聲音或影像再現對親屬很有意義,但媒體指出,這類過於擬真的AI技術可能將遭致倫理規範的嚴格檢視。

微軟昨日公布更新版負責任AI的指導準則。除了限制臉部辨識API的存取及適用情境,微軟也將模擬人聲的Azure AI自訂神經網路語音(Custom Neural Voice)服務加入控管框架,限制可以使用的客戶、明確定義可使用情境,並且清楚告知聽者,以避免欺騙與之對話的人類。


熱門新聞

Advertisement