擁有高質量的人機互動體驗,離不開「定製化」語音合成

在人機交互中,語音交互已經成為必不可少的交互形式。自然、清晰、流暢的語音是交互體驗中重要的一個環節,這就離不開語音合成技術。

極限元的語音合成技術採用國際先進的數據驅動技術,利用精心設計的語音語料庫進行聲學模型和文本處理模型的訓練,得到的模型深度挖掘了語音語言特性,合成的語音清晰、自然、親切、具有高表現力,媲美真人發聲。

而隨著人機交互市場需求的不斷變化,定製化語音合成成為發展趨勢。以人機交互中家庭生活場景為例,智能音箱算是一個典型應用,市場上的智能音箱同質化嚴重,銷售情況並不樂觀,抓住用戶痛點,調動用戶使用頻次,或許也是提高銷售的一種有效手段。試想,擁有同樣功能的智能音箱,如果聲音是嗲氣的小姐姐,或者是呆萌可愛的童聲,又或者是喜歡的偶像聲音,無論是哪一種,這樣真實豐滿的人設聲音,是不是更容易打動用戶,從而調動用戶的使用頻次。


擁有高質量的人機交互體驗,離不開「定製化」語音合成


極限元的定製化語音合成服務能夠滿足豐富的個性化聲音設定,如林志玲的嗲氣十足,郭德綱幽默逗趣,稚氣呆萌的童聲、遊戲動漫角色聲、各類方言等。極限元的定製化語音合成服務支持錄音人選型、錄音採集、語料標註,還能實現模型迭代訓練、合成引擎優化,支持在線、離線模式,適用於多種平臺,可應用於多個領域。全方位地為有需要的企業和用戶提供專屬聲音,滿足用戶在不同應用場景下的個性化音色需求。只需要提供少量發音人樣本,通過快速自適應訓練,即可合成出高自然度的個性化語音,極大的增強了用戶的體驗感。

極限元語音合成技術專業MOS分可達4.0,擁有標配版女聲和男聲,女聲包括標準型甜美型、蘿莉型;男聲包括標準型、渾厚型、清爽型。極限元已與百度、騰訊、搜狗、奇虎360、語文出版社等眾多客戶建立了長期穩定的合作關係。


擁有高質量的人機交互體驗,離不開「定製化」語音合成


讓聲音富有情感和表現力,一直是語音合成技術的一大難點。而極限元在情感語音合成領域,與國際接軌,其創始團隊源自中科院自動化研究所併成立“智能交互聯合實驗室”,號稱語音合成界的“黃埔軍校”;在人工智能領域有近20年技術積累,在國際會議和期刊上發表論文400餘篇,申請語音及音頻領域專利100餘項;作為負責人、科研骨幹參與多項國家自然基金項目、國家863項目和國家重點研發計劃等項目,獲得音視頻情感競賽第二名、北京市科學進步二等獎、中國專利獎優秀獎、Eurospeech大會獎等多種獎項。

極限元致力於為呼叫中心、智能機器人、智能家居、車載導航、有聲讀物等相關應用場景提供更加優質的語音合成服務,為用戶提供高質量的智能交互體驗。


分享到:


相關文章: