達摩院KAN-TTS首次大規模應用於天貓雙11 提供接近真人的語音交互體驗

DoNews 11月8日消息(記者 趙晉傑)11月8日,阿里巴巴宣佈達摩院機器智能實驗室最新研究成果——KAN-TTS將首次大規模應用於今年天貓雙11。基於該技術,菜鳥熱線機器人、語音機器人小蜜以及天貓精靈將為全球消費者提供接近真人的語音交互體驗。

达摩院KAN-TTS首次大规模应用于天猫双11 提供接近真人的语音交互体验

據瞭解,傳統語音合成技術需要海量文本和音頻信息,合成的語音與原始音頻的接近程度僅為85%到90%之間。今年7月,達摩院發佈新一代語音合成技術KAN-TTS,首次將該數字提高到97%以上。這被認為是入選MIT Technology Review 2019年“全球十大突破性技術”後,阿里巴巴語音技術實力的又一次跨越式提升。

基於遷移學習以及多種新型算法模型,KAN-TTS可根據特定發音人的風格快速生成高度相似的語音,並且大幅降低語音合成的門檻,手機錄音十分鐘,機器即可通過算法完成聲音的模仿。

過去數月,KAN-TTS技術已實現了主流場景風格聲音的全覆蓋,可針對通用場景、客服場景、童聲場景、英文場景和方言場景,提供 41種高品質的聲音,例如溫柔、甜蜜、嚴厲等風格。據達摩院專家透露,團隊還計劃用該技術來幫助視障和語言障礙人士實現無障礙溝通。

達摩院成立兩年以來,阿里巴巴在視覺、語音以及自然語言處理等領域已創下了多項世界紀錄,並且躍升為中國最大的人工智能公司。今年的杭州雲棲大會上,阿里巴巴表示,阿里AI每天調用超1萬億次,服務全球10億人,日處理圖像10億張、視頻120萬小時、語音55萬小時及自然語言5千億句。(完)


分享到:


相關文章: