SpeakIN憑什麼拿到上億融資?——聲紋識別做到了國際領先

近億元的融資額!這是創投圈今天傳來的一個大新聞。SpeakIN(勢必可贏科技)以及全資子公司國音科技完成了有IDG資本領投的融資。一半網民們似乎都被這“億元”金額所震驚,卻發現這則新聞的主角“勢必可贏科技”實在是讓人陌生的很。這家公司是做什麼的?憑什麼就能獲得如此鉅額的融資?

SpeakIN憑什麼拿到上億融資?——聲紋識別做到了國際領先

SpeakIN是一家創立於2015年的人工智能AI創業公司,其專注的領域是“聲紋識別技術”。他們能拿到上億元的融資,是因為真的做到了在該領域裡“重新定義”。

“重新定義”這個詞彙,近來被某手機企業弄得有點不倫不類。不過這詞兒對於SpeakIN來說卻是實實在在的正面褒義詞。他們的聲紋識別技術,讓人與設備之間的交互變得更加便捷、更加安全、更加舒適。與某手機企業不同的是,他們的聲音交互技術並非應用在那些有著超大屏幕的設備上,而是用於屏幕很小、甚至沒有屏幕的各種電子裝置。

那些場合需要聲紋識別?

所謂聲紋識別,就是人通過自己的聲音來實現設備登錄。適用於這種登錄方式的設備包括各種屏幕很小、甚至沒有屏幕的智能手錶、播放器、穿戴式設備、以及像汽車中控臺這樣的裝置。

這些設備要麼是屏幕很小、缺乏便利的輸入手段,要麼是根本沒有屏幕。傳統的密碼登陸顯然並不適合。指紋、人臉識別等手段在這些場合同樣也很難使用。這就需要採用聲紋來實現登錄了。

SpeakIN憑什麼拿到上億融資?——聲紋識別做到了國際領先

除此以外,聲紋識別在智慧零售、智能家居、以及公安部門的社會治安管理方面都有大量的應用場景。

聲紋識別技術的門檻在哪裡?SpeakIN又有何高明之處?

這種技術的工作原理聽起來很簡單,但要實際應用起來卻面臨很多障礙,只要克服了這些障礙以後才能讓實現聲紋識別技術的廣泛應用。

1. 防偽

我們在不少諜戰題材的影視劇裡都見識過偽造聲紋的伎倆。比如在《諜影重重》裡,身手不凡的主角伯恩就通過複製特工頭子的聲音,來盜取其私藏的機密文件。

這個情節其實反映了聲紋識別的一個重大缺陷:很容易被人用錄音、以及其他模擬聲音的手段來破解。

SpeakIN開發的技術就避免了聲音複製帶來的隱患。他們的系統在允許用戶登錄之前,首先會驗證其聲紋的真實性,杜絕一切偽造、複製的可能性。

2. 情緒和性別檢測

隨著人們對定製化、個性化的使用體驗要求越來越高,各種可穿戴設備、車載設備都爭相提供能根據用戶情緒和性別的不同,而呈現出差異化、定製化的功能和服務。要充分體現出這種定製化、差異化,就要求設備在登錄時,能夠判斷出使用者的情緒狀況和性別。從而把功能、服務調整到讓用戶最舒適的狀態。

SpeakIN的系統完美實現了這個檢測。

3. 人聲分離與噪音隔離

最近網上流行著一個跟聲音識別有關的段子----發現同事在使用聲控電腦,我走上去大喊一聲“全選、刪除、保存!”,喊完就跑。。。

這個段子其實也反映了聲紋識別領域內的一個重要問題:如何才能讓設備越過噪音背景,精準地識別特定用戶的聲音?

SpeakIN開發的技術,其優越之處就在於能夠很好地破解這個難題。不但能從噪音中精準區分人聲,而且還能將多個人的聲音單獨抽取出來。

關鍵在於人工智能,SpeakIN是一個AI技術公司

實現上述的這些重要功能,關鍵還是要靠人工智能技術。

無論是判斷用戶的聲音是否偽造、複製,還是判斷用戶的情緒,抑或是從龐雜的背景噪音裡精準識別出用戶的聲音,都需要系統具備高度的智能。

SpeakIN公司的關鍵技術,建基於深度學習的iVector技術。他們已經實現了大規模工業級的聲紋識別系統,並且實現了高識別率和高抗干擾性,其聲紋提取、驗證的速度和準確率在行業中遙遙領先。

被谷歌眼鏡啟發的創始人

陳昊亮,SpeakIN的創始人兼CEO,曾經在谷歌眼鏡的人機互動項目組裡工作過。那段經歷讓他對可穿戴式設備有了極深的體會。他敏銳地察覺到可穿戴式設備將來必大行於世,而與其相匹配的聲紋識別技術也必然擁有龐大的市場。

SpeakIN憑什麼拿到上億融資?——聲紋識別做到了國際領先

2015年創業後,SpeakIN已經雲集了大批頂尖的人工智能、聲紋識別算法和機器學習領域內的專家學者。今後他們將針對更多的行業進行應用場景的定製開發,促進聲紋識別技術的進一步發展。

本次融資領投方IDG資本方面則認為,SpeakIN專注的聲紋識別技術是人工智能時代的重要組成部分。而這種技術在中國的應用場景將會越來越豐富,發展前途令人樂觀。


分享到:


相關文章: