雲知聲攜手國家電網及平安好醫生 打造行業一流水準聲紋系統

聲紋識別(Voiceprint Recognition,VPR)也稱說話人識別,是一種通過聲音判別說話人身份的技術,分為說話人辨識和說話人確認。前者用以判斷某段語音是若干人中的哪一個所說的,即“ N 選一”;後者用以確認某段語音是否是指定的某人所說,是“1對1匹配”問題。不同的任務和應用會使用不同的聲紋識別技術,如縮小刑偵範圍時可能需要辨認技術,而銀行交易時則需用到確認技術。

雲知聲攜手國家電網及平安好醫生 打造行業一流水準聲紋系統

雲知聲在聲紋技術領域深耕多年,是國內為數不多具備全棧語音技術能力的人工智能公司。早在 2004 年,尚就職於摩托羅拉公司的雲知聲創始人黃偉博士便帶領團隊研發出世界上第一款手機聲紋認證系統,搭載該系統的相關產品總計銷量超 2 億臺。

雖然聲紋識別優勢明顯,但要想準確分辨聲音特徵卻並非易事。首先,聲紋識別系統性能會受用戶發聲狀態影響,如用戶的身體狀況、情緒等都會影響識別準確度。其次,環境的嘈雜度,以及採集、傳輸音頻的硬件配置,都會在不同程度上對識別系統行成干擾。為解決上述問題,雲知聲聲紋技術團隊進行了一系列技術攻堅與創新。

首先,依託雲知聲強大的語音信號前端處理技術,如 VAD、語音降噪等,準確地捕捉到人聲並進行背景噪聲消除。

其次,雲知聲將 DNN 引入到傳統聲紋識別 ivector 技術框架中,並融合最新端到端聲紋識別技術,基於雲知聲超算平臺和海量聲紋訓練數據,使得模型得以學習到數萬說話人,每人多種發聲的特性,且在雲端針對每個用戶採用說話人自適應技術,達到越用越好的效果。在信道處理上,採用 PLDA 信道補償技術,可將信道影響降到最小。

雲知聲攜手國家電網及平安好醫生 打造行業一流水準聲紋系統

近年來,伴隨深度學習的興起,雲知聲在國內率先將深度學習技術使用到語音識別中,且後續引入到聲紋識別領域,解決了一系列聲紋技術實用難點,並應用到實際產品上。

在1月7日政法委“新時代市域社會治理智能應用交流展”上,雲知聲在公檢法領域的聲紋身份驗證和反欺詐方案得到了各級政法委領導的高度讚揚,表示這才是真正的“智治”,讓AI成為政府和社會組織實施精準治理、智能治理的重要利器,協助公安部門減少案發、更快破案,為平安城市保駕護航。

近日,中國領先的一站式醫療健康生態平臺平安好醫生宣佈,由雲知聲提供聲紋技術支持的平安好醫生客戶端“聲紋登陸系統”在經過多次模型優化和升級迭代後,登陸成功率接近99%,達行業一流水準。

與此同時,為保障用戶登陸的“安全性”,雲知聲為平安好醫生客戶端聲紋登錄系統提供數字串註冊和登錄的“文本弱相關”技術,工程難度更高,安全性更強。在同一賬號下,雲知聲聲紋識別產品可支持 6 人註冊。在客戶端雲知聲提供封裝好的 SDK,支持聲紋註冊、登錄、解綁等接口,供上層調用 API 實現產品邏輯。

此外,雲知聲與國家電網合作的會議系統聲紋識別項目更是實現了10人以內聲紋庫識別率高達90%以上。此係統採用雲知聲最先進的聲紋識別、語音識別技術,準確識別會議中的發言人身份和發言內容,形成完整會議記錄,方便歸檔、追溯,實現會議全過程的數字化,推動會議管理的智能化發展。

同時,雲知聲還提供成熟的聲紋服務私有化部署方案,基於在金融、客服、快遞等不同行業豐富的私有云部署經驗,可有效保障客戶數據安全。未來,雲知聲將更成熟、更先進的聲紋技術與產品應用到金融、醫療、教育、公檢法等領域。


分享到:


相關文章: