百度輸入法日均語音請求量破10億次,對輸入法行業意味著什麼?

文|鄰章

從手寫輸入、字根五筆輸入到拼音輸入,輸入法輸入方式的進步,不僅推動著行業效率的提升,同時也讓輸入法擁有了更為廣泛的用戶基礎。正是在不斷提升輸入效率與增大用戶覆蓋度的初衷下,輸入法行業事實上也一直在探尋著更為先進的輸入方式,在此,具備人類自然習慣特徵的語音輸入已然成為各大輸入法發力的重點。

百度輸入法日均語音請求量破10億次,對輸入法行業意味著什麼?

如我們所見,當前國內主流的百度輸入法、搜狗輸入法、訊飛輸入法等早已在語音輸入上競相發力,試圖在推動AI技術落地的同時搶佔未來交互方式,創造新的可能性。而從目前各家在語音輸入的進度來看,百度輸入法正先於搜狗輸入法和訊飛輸入法來到第一個賽點,率先達成日均語音輸入請求量突破10億次的“小目標”——近日,百度輸入法對外宣佈:自2020年1月25日春節假期以來,百度輸入法日均語音請求量已破10億次,創行業歷史新高。

日均請求量破10億次,語音輸入的第一個賽點

隨著智能語音技術的發展和語音輸入功能的不斷創新,讓語音輸入在不同語種、口音、場景下的使用門檻得以大幅降低,而也由此讓用戶使用率在一定程度上得到了提升。但從現實來說,在過往很長一段時間內,用戶在輸入法中使用語音輸入的日均請求量卻一直未能突破10億次,最好的數據也僅為8億多次。此番百度輸入法的日均語音請求量直接突破10億次大關,對語音輸入來說顯然是一次重大躍升,特別是考慮到當下整體智能手機市場進入存量期的現實,對於整個行業而言,都可以說是一次提振。這也是為何日均語音請求量突破10億次可看作是語音輸入的第一個賽點的原因所在——它代表了用戶對語音輸入這一新輸入方式的接受度達到了一個新的維度,意味著語音輸入已經具備了相對廣泛的用戶基礎,用戶使用語音輸入的習慣正在逐步形成。

若以艾媒諮詢發佈的《2019上半年中國第三方手機輸入法專題研究報告》中提到的百度輸入法2.71億語音輸入用戶為基數來測算,那麼當下百度輸入法日均語音請求量突破10億次大關則意味著用戶的輸入頻率已接近3.7次/日。

當然,這只是一個平均數,在現實用戶中肯定存在使用語音輸入高頻與低頻的區別,但這仍足以說明使用語音輸入的習慣在相當多的用戶中已然開始形成。而這為語音輸入走進下一個賽點,達成百億、千億日均請求量,直至成為與當前拼音輸入一樣自然普遍的輸入方式打下了堅實基礎。

先至賽點,技術以人為本的回報

在此,問題也隨之而來,同在語音輸入賽道,為何百度輸入法語音輸入能先至賽點,領跑行業?在個人看來,這或是百度輸入法語音輸入踐行技術以人為本而得到的用戶回饋。

從現實來說,輸入法作為一款極具高頻特徵的工具型應用,用戶衡量這款工具與其功能的核心指標自然也會落腳到這款產品的功能與體驗上。而從現實來說,百度輸入法日均語音請求量率先突破10億次大關,其實足以說明用戶對百度輸入法語音輸入功能的認可。事實上,在艾媒諮詢發佈的《2019中國第三方手機輸入法市場年度專題研究報告》中,我們也看到百度輸入法語音輸入在準確率、用戶滿意度上均位列行業第一。

百度輸入法日均語音請求量破10億次,對輸入法行業意味著什麼?

但也眾所周知的是,不同於字根輸入或是拼音輸入相對直接的反饋,語音輸入雖然從用戶角度來看是更為自然便捷的輸入方式,但是對於輸入法而言,其要將用戶說出的語音快速而又準確無誤的轉化為文字,事實上是一件頗具難度的事情,特別是考慮到人類語音的多樣性以及獨特的地域性特徵。而這也使得語音識別涉及了諸如信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能乃至人的體態語言等多領域。顯然這也將大大考驗輸入法廠商的技術能力。

在此,百度輸入法語音輸入能在準確率、用戶滿意度上均獲行業第一,與百度世界領先的語音技術帶來的技術支撐自是密不可分。事實上百度輸入法凝聚了百度深耕多年的語音、圖像、NLP和知識圖譜等AI能力。諸如:

1、離線在線,語音識別高精準度不變

對於語音輸入而言,能夠快速準確的識別用戶所言是其被用戶反覆使用的基礎。若是用戶在使用過程中,三番五次不能準確識別,用戶對其的使用慾望必會大大降低。但要達成對用戶語音的快速識別,則需要語音識別這一讓機器通過識別和理解把語音信號轉變為相應文本或命令的核心技術做支撐。而這正是百度的拿手好戲,自2012年就開始在語音識別領域大手筆投入的百度,可以說正引領語音識別技術浪潮。最新的一例是在2019年,百度為進一步提升用戶在語音輸入時語音識別準確率,其將流式截斷多層注意力建模(SMLTA)用於百度輸入法中——這是全世界範圍內第一次基於Attention技術的在線語音識別服務的大規模上線。

領先的技術優勢當然也帶來了領先行業的效果。數據顯示:SMLTA技術將百度輸入法在線語音相對準確率提升15%,超越行業最優競品15%。同時,百度輸入法也將SMLTA技術應用於離線狀態下,用以解決過往用戶在地鐵、電梯、隧道或人流密集等離線場景中遭遇的語音識別不暢的痛點。從結果來看,SMLTA技術讓百度輸入法語音輸入在離線狀態下的識別精度達到了在線語音同樣水平,與行業對手相比,當下百度輸入法離線語音輸入準確率已高於行業平均水平35%。

正是基於百度在語音識別領域的多年深耕,將SMLTA技術這種領先於行業的技術運用於百度輸入法中,也讓百度輸入法語音輸入無論是在線還是離線狀態,都能大大領先於競爭對手,為用戶帶來高識別精度體驗,而這也為百度輸入法語音輸入獲得行業第一的準確度以及滿意度打下了堅實的基礎。

百度輸入法日均語音請求量破10億次,對輸入法行業意味著什麼?

2、無懼鄉音,讓方言自由說

如前所述,人類的言語具備多樣性以及獨特的地域性特徵,使得當下我國的通用語言雖然是普通話,但在人們的日常交流中則是使用方言居多,而據教育部2019年文獻《中國語言文字概況》介紹,漢語方言可分為官話方言、晉方言、吳方言、徽方言、閩方言、粵方言、客家方言、贛方言、湘方言、平話土話十大方言,並且在這些複雜的方言區內,還可以再分列為若干個方言片(又稱為次方言)甚至“方言小片”乃至明確到一個個地點(某市、某縣、某鎮、某村)的地方方言,如四川話、重慶話、廣州話等。

方言眾多的現實,無疑是加大了語言識別的難度,但從處於方言區的用戶角度來看,卻是鄉音自由流露要比使用普通話自然得多。而這也需要語音輸入產品從用戶角度出發,研發出契合不同語言區用戶的使用習慣,讓他們說方言也能夠使用語音輸入功能,而不是逼迫不同方言區的用戶統一使用普通話這一種語音輸入方式。

在此,我們看到百度輸入法為此上線了“方言自由說”——其通過技術優化,將普通話和六大方言融合成一個語音識別模型,實現了方言與方言、方言與普通話的混合語音輸入,而無需用戶首先選擇一種“方言識別”、來回切換。

3.不分中外,讓中英自由說

隨著對外交流的不斷加深,新語態的不斷湧現,在諸多行業中,中英文混說已成為一種常態。但對於輸入法語音輸入而言這卻成為了新的難題,是頗具難度的存在,以至於在很長一段時間裡各家語音輸入都只能實現一些簡單英文單詞的中英混輸,並且還會影響到中文識別準確率。

面對現實存在的用戶需求與實現中英文混說的技術難點,百度輸入法卻推出了「中英自由說」,實現了在完全不影響中文語音輸入準確率的情況下,高精準的中英文混合語音輸入,成為了當前唯一實現高精準中英文混合語音輸入的輸入法產品。而其實現方式其實與通過實現方言自由說的訓練方式有著相似的邏輯——在語音識別算法SMLTA技術支撐下,百度輸入法通過對中文音節和英文音素混合建模,並基於海量純中文、純英文和中英文三類大數據進行模型訓練,再將純中文、純英文和中英文三類語言模型並行解碼,融合標點和大小寫進行處理。

百度輸入法日均語音請求量破10億次,對輸入法行業意味著什麼?

上述只是百度輸入法將諸多AI技術無聲的融入產品,切實提升用戶使用體驗,想用戶之所想,滿足不同用戶需求的冰山一角。而在我看來,這倒也生動詮釋了科技以人為本、技術為更好的含義。在此之外,事實上基於NLP、圖像識別、AR等技術,百度輸入法還推出了NLP整句預測、AI鬥圖、神句配圖、皮膚主體C位識別等AI功能,成為業內首家實現多場景整句智能預測的輸入法產品,在大大提升輸入效率的同時更提升了輸入法產品的可玩性。

這種將技術無聲融入產品,為用戶切實帶來體驗提升,用戶自然也會為之投票,所以用戶選擇百度輸入法,高頻使用百度輸入法語音輸入,使其日均請求量率先達到10億次賽點,自是水到渠成。

語音輸入,讓輸入無處不在

事實上,從行業來看,AI加持的語音輸入也正在成為引領未來的輸入新方式。

其實早在2016年,互聯網女皇瑪麗·米克爾就在其《互聯網趨勢》(Internet Trends)報告中預判:“語音正在被重塑,成為人機交互的新範式。在過去75年裡,每10年就有一次人機交互的重大革新。人類對機器的操作,從物理手柄按鍵,到物理鍵盤鼠標,再到觸摸屏,而現在語音成為了重要的交互方式。”

當下百度輸入法、搜狗輸入法、訊飛輸入法等積極將AI技術與輸入法相結合,在語音輸入這種更具普惠與自然性的輸入方式上探索深耕,無疑也是試圖在新舊交互交替之際,搶先拿到語音交互這一人機交互新範式,進而讓輸入法產品突破當前產品的桎梏,走入更為廣闊的IoT設備中,讓語音輸入這種更自然、高效的輸入模式更加的無處不在。

誠如百度CTO王海峰在2019年百度輸入法“AI·新輸入全感官輸入2.0”發佈會上所言:輸入法是離用戶最近的產品之一,也是AI落地的“橋頭堡”,未來的輸入法更將應用於各種智能設備與用戶的交互,連通包括智能家居、車聯網等多種終端場景。

若是考慮到當前的輸入法產品事實上已經嫁接起了許多應用,形成了輸入法內應用直達的現實,那麼在新基建時代,輸入法其實更具備成為超級入口的潛力。

而從這個層面來說,百度輸入法語音輸入日均請求量率先突破10億次,就更具意義了——在進一步引領行業探索語音輸入這種未來輸入方式信息的同時,也或將助力百度在新基建時代搶先把握住這一超級入口。

作者:鄰章,關注智能手機、人工智能、消費&產業互聯網等。


分享到:


相關文章: