一文了解全球語音技術市場格局

一文了解全球語音技術市場格局

與機器進行語音交流,讓它能聽明白你在說什麼,是人類一直以來的夢想。自從1952年貝爾研究所研製出了世界上第一個能識別10個英文數字發音的實驗系統再到1960年英國的Denes等人研製了第一個計算機語音識別系統。語音技術開始獲得了高速的發展。目前,人類已經將夢想變成了現實,語音識別已成為人與機器通過自然語言交互的重要方式之一。

一、語音技術市場格局

隨著互聯網技術的高速發展,人類越來越依賴著機器設備的人工性和智能性。以語音技術為代表,它深入到人類生活的大多數領域。如:智能傢俱家電、移動互聯網、汽車自動駕駛、醫療等。

1.全球:

據中商產業數據統計,2018年全球智能語音市場規模達到141.1億美元。其中,在全球智能語音市場佔比情況中,各巨頭市場佔有率分別為:Nuance(31.60%)、谷歌(28.40%)、蘋果(15.40%)、微軟(8.10%)和科大訊飛(4.50%)等。值得注意的是科大訊飛已經超越老牌計算機巨頭IBM位列全球第五位。

全球智能語音市場規模及佔有率

一文了解全球語音技術市場格局

2.國內:

中國擁有龐大的用戶群基礎以及互聯網系統優勢。近年來隨著中國智能語音技術的專利數量持續增長,國內智能語音市場規模不斷擴大。數據顯示,2017年中國智能語音市場規模達到105.7億元,與2016年相比增長70%。隨著智能語音應用產業的拓展,市場需求增大,2018年中國智能語音市場規模預計再進一步增長,達到159.7億元。

中國智能語音市場規模及佔有率

一文了解全球語音技術市場格局

數據顯示,截至目前為止,中國智能語音市場,科大訊飛市場佔有率排名第一,達到44.20%;其次為百度,市場佔有率為27.80%,排名第三是蘋果,市場佔有率為6.90%。其後分別為Nuance和小i機器人,佔有3.0%、2.70%的市場份額。整體來看,中國智能語音市場的主要份額被科大訊飛、百度以及蘋果三大巨頭分割。

二、語音技術工作原理

瞭解了語音技術的市場狀況,然而我們大多數人都不太清楚語音技術的工作原理是怎樣的。其實它的工作原理很容易理解,語音技術本質就是將語音序列轉換為文本序列的過程,工作原理包括三大過程:

語音識別系統流程

一文了解全球語音技術市場格局

1.前端信號處理

前端的信號處理是對原始語音信號進行相關處理,使處理後的信號更能代表語音的本質特徵。具體過程劃分五步:對原始語音進行活動檢測—降噪—回聲混聲消除—聲源定位—波束形成。

2.聲學模型和語言模型

通過前端信號處理把語音序列轉換成文本序列後,需要對可能的文本序列轉換成一個詞,接下來這個過程需要用到聲學模型和語言模型。聲學模型是將語音信號的觀測特徵與句子的語音建模單元聯繫起來,即計算。而語言模型則與文本處理相關,比如我們使用的智能輸入法,當我們輸入“nihao”的時候,輸入法候選詞會出現“你好”而不是“擬好”,候選詞的排列將參照語言模型得分的高低順序。同時,語音識別中的語言模型也應用於處理文字序列,它是通過結合聲學模型的輸出而給出概率最大的文字序列作為語音識別的結果。

聲學模型示意圖

一文了解全球語音技術市場格局

3.語音識別效果展示

以上幾個過程串聯起來,基本上形成了一個簡單的語音技術工作框架,之後在檢測過程進行不斷修正,基本上可以把語音識別效果展示出來了。

三、全球知名語音技術公司介紹

目前全球知名語音技術公司有:

1.Nuance

Nuance公司專門從事語音識別軟件、圖像處理軟件及輸入法軟件研發、銷售。目前世界上最先進的電腦語音識別軟件Naturally Speaking就出自於Nuance公司。T9智能文字輸入法是該公司的旗艦產品,該產品功能強大,支持超過70種語言,是業內認同的標準輸入法,被眾多OEM廠商內置,其中包括三星、諾基亞、索愛、LG、夏普、海爾、華為等等,在全球市場佔有率超過70%,在中國市場佔有率超過50%。

一文了解全球語音技術市場格局


2.Google

谷歌是一家位於美國的跨國科技企業,業務包括互聯網搜索、雲計算、廣告技術等,同時開發並提供大量基於互聯網的產品與服務,Google Now語音技術為其中代表。目前,Google Now已經佔據了15%的智能音箱市場份額,智能手機語音助理的市場份額為46%。

一文了解全球語音技術市場格局


3.Apple

Siri是一款可以調用應用的聊天機器人。2010年蘋果以2億美金收購Siri,隨後通過與全球最大的語音識別廠商Nuance合作,實現了語音識別功能。目前經過一系列技術完善,Siri可以支持自然語言輸入,並且可以調用系統自帶的天氣預報、日程安排、搜索資料等應用,還能夠不斷學習新的聲音和語調,提供對話式的應答。新興設備技術(EDT)研究服務最新發布的報告發現谷歌助手以50%的份額成為全球第一大虛擬助手,其次是蘋果的Siri。

一文了解全球語音技術市場格局

4.Cornata

微軟在全球推出了覆蓋語音、視覺、語言、機器翻譯等功能的24項服務,目前已經有超過100萬開發者使用認知服務。語音助手Cortana是微軟在機器學習和人工智能領域方面的嘗試,Cortana可以記錄用戶的行為和使用習慣,利用雲計算、搜索引擎和“非結構化數據”分析,讀取和學習包括手機中的圖片、視頻、電子郵件等數據理解用戶的語義和語境,從而實現人機交互。據統計,每一臺Windows 設備都裝載了Cortana,其月活躍用戶數達到了驚人的1.45億人次(用戶可能主要是通過XBox訪問),Cortana在智能音響設備上的份額很小,然而伴隨著微軟龐大的整體用戶群,其市場份額也在不斷增長之中。

一文了解全球語音技術市場格局

5.科大訊飛

科大訊飛股份有限公司(股票代碼002230)從事智能語音及語言技術研究、軟件及芯片產品開發、語音信息服務及電子政務系統集成。科大訊飛擁有自主知識產權的世界領先智能語音技術,產品覆蓋範圍從大型電信級應用到小型嵌入式應用,從電信、金融等行業到企業和家庭用戶,從PC到手機到MP3/MP4/PMP和玩具。

一文了解全球語音技術市場格局

目前,科大訊飛佔有中文語音技術市場70%以上市場份額,語音合成產品市場份額達到70%以上,在電信、金融、電力、社保等主流行業的份額更達80%以上,開發夥伴超過10000家,擁有靈犀語音助手,訊飛輸入法等優秀產品。其中,靈犀定製語音助手在同類產品中用戶規模排名第一。

點擊觀看科大訊飛個股基本面視頻


分享到:


相關文章: