從不溫不火到炙手可熱：語音識別技術簡史

2020-12-14 23:18:07 佚名

作者 | 陳孝良，馮大航，李智勇

出品 | AI科技大本營（ID: rgznai100）

【導讀】語音識別自半個世紀前誕生以來，一直處於不溫不火的狀態，直到 2009 年深度學習技術的長足發展才使得語音識別的精度大大提高，雖然還無法進行無限制領域、無限制人群的應用，但也在大多數場景中提供了一種便利高效的溝通方式。本篇文章將從技術和產業兩個角度來回顧一下語音識別發展的歷程和現狀，並分析一些未來趨勢，希望能幫助更多年輕技術人員瞭解語音行業，並能產生興趣投身於這個行業。

語音識別，通常稱為自動語音識別，英文是Automatic Speech Recognition，縮寫為 ASR，主要是將人類語音中的詞彙內容轉換為計算機可讀的輸入，一般都是可以理解的文本內容，也有可能是二進制編碼或者字符序列。但是，我們一般理解的語音識別其實都是狹義的語音轉文字的過程，簡稱語音轉文本識別（ Speech To Text, STT ）更合適，這樣就能與語音合成(Text To Speech, TTS )對應起來。

語音識別是一項融合多學科知識的前沿技術，覆蓋了數學與統計學、聲學與語言學、計算機與人工智能等基礎學科和前沿學科，是人機自然交互技術中的關鍵環節。但是，語音識別自誕生以來的半個多世紀，一直沒有在實際應用過程得到普遍認可，一方面這與語音識別的技術缺陷有關，其識別精度和速度都達不到實際應用的要求；另一方面，與業界對語音識別的期望過高有關，實際上語音識別與鍵盤、鼠標或觸摸屏等應是融合關係，而非替代關係。

深度學習技術自 2009 年興起之後，已經取得了長足進步。語音識別的精度和速度取決於實際應用環境，但在安靜環境、標準口音、常見詞彙場景下的語音識別率已經超過 95%，意味著具備了與人類相仿的語言識別能力，而這也是語音識別技術當前發展比較火熱的原因。

隨著技術的發展，現在口音、方言、噪聲等場景下的語音識別也達到了可用狀態，特別是遠場語音識別已經隨著智能音箱的興起成為全球消費電子領域應用最為成功的技術之一。由於語音交互提供了更自然、更便利、更高效的溝通形式，語音必定將成為未來最主要的人機互動接口之一。

當然，當前技術還存在很多不足，如對於強噪聲、超遠場、強幹擾、多語種、大詞彙等場景下的語音識別還需要很大的提升；另外，多人語音識別和離線語音識別也是當前需要重點解決的問題。雖然語音識別還無法做到無限制領域、無限制人群的應用，但是至少從應用實踐中我們看到了一些希望。

本篇文章將從技術和產業兩個角度來回顧一下語音識別發展的歷程和現狀，並分析一些未來趨勢，希望能幫助更多年輕技術人員瞭解語音行業，並能產生興趣投身於這個行業。

語音識別的技術歷程

現代語音識別可以追溯到 1952 年，Davis 等人研製了世界上第一個能識別 10 個英文數字發音的實驗系統，從此正式開啟了語音識別的進程。語音識別發展到今天已經有 70 多年，但從技術方向上可以大體分為三個階段。

下圖是從 1993 年到 2017 年在 Switchboard 上語音識別率的進展情況，從圖中也可以看出 1993 年到 2009 年，語音識別一直處於 GMM-HMM 時代，語音識別率提升緩慢，尤其是 2000 年到 2009 年語音識別率基本處於停滯狀態；2009 年隨著深度學習技術，特別是 DNN 的興起，語音識別框架變為 DNN-HMM，語音識別進入了 DNN 時代，語音識別精準率得到了顯著提升；2015 年以後，由於“端到端”技術興起，語音識別進入了百花齊放時代，語音界都在訓練更深、更復雜的網絡，同時利用端到端技術進一步大幅提升了語音識別的性能，直到 2017 年微軟在 Swichboard 上達到詞錯誤率 5.1%，從而讓語音識別的準確性首次超越了人類，當然這是在一定限定條件下的實驗結果，還不具有普遍代表性。

GMM-HMM時代

70 年代，語音識別主要集中在小詞彙量、孤立詞識別方面，使用的方法也主要是簡單的模板匹配方法，即首先提取語音信號的特徵構建參數模板，然後將測試語音與參考模板參數進行一一比較和匹配，取距離最近的樣本所對應的詞標註為該語音信號的發音。該方法對解決孤立詞識別是有效的，但對於大詞彙量、非特定人連續語音識別就無能為力。因此，進入 80 年代後，研究思路發生了重大變化，從傳統的基於模板匹配的技術思路開始轉向基於統計模型（HMM）的技術思路。

HMM 的理論基礎在 1970 年前後就已經由 Baum 等人建立起來，隨後由 CMU 的 Baker 和 IBM 的 Jelinek 等人將其應用到語音識別當中。HMM 模型假定一個音素含有 3 到 5 個狀態，同一狀態的發音相對穩定，不同狀態間是可以按照一定概率進行跳轉；某一狀態的特徵分佈可以用概率模型來描述，使用最廣泛的模型是 GMM。因此 GMM-HMM 框架中，HMM 描述的是語音的短時平穩的動態性，GMM 用來描述 HMM 每一狀態內部的發音特徵。

基於 GMM-HMM 框架，研究者提出各種改進方法，如結合上下文信息的動態貝葉斯方法、區分性訓練方法、自適應訓練方法、HMM/NN 混合模型方法等。這些方法都對語音識別研究產生了深遠影響，併為下一代語音識別技術的產生做好了準備。自上世紀 90 年代語音識別聲學模型的區分性訓練準則和模型自適應方法被提出以後，在很長一段內語音識別的發展比較緩慢，語音識別錯誤率那條線一直沒有明顯下降。

DNN-HMM時代

2006年，Hinton 提出深度置信網絡（DBN），促使了深度神經網絡（DNN）研究的復甦。2009 年，Hinton 將 DNN 應用於語音的聲學建模，在 TIMIT 上獲得了當時最好的結果。2011 年底，微軟研究院的俞棟、鄧力又把 DNN 技術應用在了大詞彙量連續語音識別任務上，大大降低了語音識別錯誤率。從此語音識別進入 DNN-HMM 時代。

DNN-HMM主要是用 DNN 模型代替原來的 GMM 模型，對每一個狀態進行建模，DNN 帶來的好處是不再需要對語音數據分佈進行假設，將相鄰的語音幀拼接又包含了語音的時序結構信息，使得對於狀態的分類概率有了明顯提升，同時DNN還具有強大環境學習能力，可以提升對噪聲和口音的魯棒性。

簡單來說，DNN 就是給出輸入的一串特徵所對應的狀態概率。由於語音信號是連續的，不僅各個音素、音節以及詞之間沒有明顯的邊界，各個發音單位還會受到上下文的影響。雖然拼幀可以增加上下文信息，但對於語音來說還是不夠。而遞歸神經網絡（RNN）的出現可以記住更多歷史信息，更有利於對語音信號的上下文信息進行建模。

由於簡單的 RNN 存在梯度爆炸和梯度消散問題，難以訓練，無法直接應用於語音信號建模上，因此學者進一步探索，開發出了很多適合語音建模的 RNN 結構，其中最有名的就是 LSTM 。LSTM 通過輸入門、輸出門和遺忘門可以更好的控制信息的流動和傳遞，具有長短時記憶能力。雖然 LSTM 的計算複雜度會比 DNN 增加，但其整體性能比 DNN 有相對 20% 左右穩定提升。

BLSTM 是在 LSTM 基礎上做的進一步改進，不僅考慮語音信號的歷史信息對當前幀的影響，還要考慮未來信息對當前幀的影響，因此其網絡中沿時間軸存在正向和反向兩個信息傳遞過程，這樣該模型可以更充分考慮上下文對於當前語音幀的影響，能夠極大提高語音狀態分類的準確率。BLSTM 考慮未來信息的代價是需要進行句子級更新，模型訓練的收斂速度比較慢，同時也會帶來解碼的延遲，對於這些問題，業屆都進行了工程優化與改進，即使現在仍然有很多大公司使用的都是該模型結構。

圖像識別中主流的模型就是 CNN，而語音信號的時頻圖也可以看作是一幅圖像，因此 CNN 也被引入到語音識別中。要想提高語音識別率，就需要克服語音信號所面臨的多樣性，包括說話人自身、說話人所處的環境、採集設備等，這些多樣性都可以等價為各種濾波器與語音信號的卷積。而 CNN 相當於設計了一系列具有局部關注特性的濾波器，並通過訓練學習得到濾波器的參數，從而從多樣性的語音信號中抽取出不變的部分，CNN 本質上也可以看作是從語音信號中不斷抽取特徵的一個過程。CNN 相比於傳統的 DNN 模型，在相同性能情況下，前者的參數量更少。

綜上所述，對於建模能力來說，DNN 適合特徵映射到獨立空間，LSTM 具有長短時記憶能力，CNN 擅長減少語音信號的多樣性，因此一個好的語音識別系統是這些網絡的組合。

端到端時代

語音識別的端到端方法主要是代價函數發生了變化，但神經網絡的模型結構並沒有太大變化。總體來說，端到端技術解決了輸入序列的長度遠大於輸出序列長度的問題。端到端技術主要分成兩類：一類是 CTC 方法，另一類是 Sequence-to-Sequence 方法。傳統語音識別 DNN-HMM 架構裡的聲學模型，每一幀輸入都對應一個標籤類別，標籤需要反覆的迭代來確保對齊更準確。

採用 CTC 作為損失函數的聲學模型序列，不需要預先對數據對齊，只需要一個輸入序列和一個輸出序列就可以進行訓練。CTC 關心的是預測輸出的序列是否和真實的序列相近，而不關心預測輸出序列中每個結果在時間點上是否和輸入的序列正好對齊。CTC 建模單元是音素或者字，因此它引入了 Blank。對於一段語音，CTC 最後輸出的是尖峰的序列，尖峰的位置對應建模單元的 Label，其他位置都是 Blank。

Sequence-to-Sequence 方法原來主要應用於機器翻譯領域。2017 年，Google 將其應用於語音識別領域，取得了非常好的效果，將詞錯誤率降低至5.6%。如下圖所示，Google 提出新系統的框架由三個部分組成：Encoder 編碼器組件，它和標準的聲學模型相似，輸入的是語音信號的時頻特徵；經過一系列神經網絡，映射成高級特徵 henc，然後傳遞給 Attention 組件，其使用 henc 特徵學習輸入 x 和預測子單元之間的對齊方式，子單元可以是一個音素或一個字。最後，attention 模塊的輸出傳遞給 Decoder，生成一系列假設詞的概率分佈，類似於傳統的語言模型。

端到端技術的突破，不再需要 HMM 來描述音素內部狀態的變化，而是將語音識別的所有模塊統一成神經網絡模型，使語音識別朝著更簡單、更高效、更準確的方向發展。

語音識別的技術現狀

目前，主流語音識別框架還是由 3 個部分組成：聲學模型、語言模型和解碼器，有些框架也包括前端處理和後處理。隨著各種深度神經網絡以及端到端技術的興起，聲學模型是近幾年非常熱門的方向，業界都紛紛發佈自己新的聲學模型結構，刷新各個數據庫的識別記錄。由於中文語音識別的複雜性，國內在聲學模型的研究進展相對更快一些，主流方向是更深更復雜的神經網絡技術融合端到端技術。

2018年，科大訊飛提出深度全序列卷積神經網絡（DFCNN），DFCNN 使用大量的卷積直接對整句語音信號進行建模，主要借鑑了圖像識別的網絡配置，每個卷積層使用小卷積核，並在多個卷積層之後再加上池化層，通過累積非常多卷積池化層對，從而可以看到更多的歷史信息。

2018年，阿里提出 LFR-DFSMN（Lower Frame Rate-Deep Feedforward Sequential Memory Networks）。該模型將低幀率算法和 DFSMN 算法進行融合，語音識別錯誤率相比上一代技術降低 20%，解碼速度提升 3 倍。FSMN 通過在 FNN 的隱層添加一些可學習的記憶模塊，從而可以有效的對語音的長時相關性進行建模。而 DFSMN 是通過跳轉避免深層網絡的梯度消失問題，可以訓練出更深層的網絡結構。

2019 年，百度提出了流式多級的截斷注意力模型 SMLTA，該模型是在 LSTM 和 CTC 的基礎上引入了注意力機制來獲取更大範圍和更有層次的上下文信息。其中流式表示可以直接對語音進行一個小片段一個小片段的增量解碼；多級表示堆疊多層注意力模型；截斷則表示利用 CTC 模型的尖峰信息，把語音切割成一個一個小片段，注意力模型和解碼可以在這些小片段上展開。在線語音識別率上，該模型比百度上一代 Deep Peak2 模型提升相對 15% 的性能。

開源語音識別 Kaldi 是業界語音識別框架的基石。Kaldi 的作者 Daniel Povey 一直推崇的是 Chain 模型。該模型是一種類似於 CTC 的技術，建模單元相比於傳統的狀態要更粗顆粒一些，只有兩個狀態，一個狀態是 CD Phone，另一個是 CD Phone 的空白，訓練方法採用的是 Lattice-Free MMI 訓練。該模型結構可以採用低幀率的方式進行解碼，解碼幀率為傳統神經網絡聲學模型的三分之一，而準確率相比於傳統模型有非常顯著的提升。

遠場語音識別技術主要解決真實場景下舒適距離內人機任務對話和服務的問題，是 2015 年以後開始興起的技術。由於遠場語音識別解決了複雜環境下的識別問題，在智能家居、智能汽車、智能會議、智能安防等實際場景中獲得了廣泛應用。目前國內遠場語音識別的技術框架以前端信號處理和後端語音識別為主，前端利用麥克風陣列做去混響、波束形成等信號處理，以讓語音更清晰，然後送入後端的語音識別引擎進行識別。

語音識別另外兩個技術部分：語言模型和解碼器，目前來看並沒有太大的技術變化。語言模型主流還是基於傳統的 N-Gram 方法，雖然目前也有神經網絡的語言模型的研究，但在實用中主要還是更多用於後處理糾錯。解碼器的核心指標是速度，業界大部分都是按照靜態解碼的方式進行，即將聲學模型和語言模型構造成 WFST 網絡，該網絡包含了所有可能路徑，解碼就是在該空間進行搜索的過程。由於該理論相對成熟，更多的是工程優化的問題，所以不論是學術還是產業目前關注的較少。

語音識別的技術趨勢

語音識別主要趨於遠場化和融合化的方向發展，但在遠場可靠性還有很多難點沒有突破，比如多輪交互、多人噪雜等場景還有待突破，還有需求較為迫切的人聲分離等技術。新的技術應該徹底解決這些問題，讓機器聽覺遠超人類的感知能力。這不能僅僅只是算法的進步，需要整個產業鏈的共同技術升級，包括更為先進的傳感器和算力更強的芯片。

單從遠場語音識別技術來看，仍然存在很多挑戰，包括：

（1）回聲消除技術。由於喇叭非線性失真的存在，單純依靠信號處理手段很難將回聲消除乾淨，這也阻礙了語音交互系統的推廣，現有的基於深度學習的回聲消除技術都沒有考慮相位信息，直接求取的是各個頻帶上的增益，能否利用深度學習將非線性失真進行擬合，同時結合信號處理手段可能是一個好的方向。

（2）噪聲下的語音識別仍有待突破。信號處理擅長處理線性問題，深度學習擅長處理非線性問題，而實際問題一定是線性和非線性的疊加，因此一定是兩者融合才有可能更好地解決噪聲下的語音識別問題。

（3）上述兩個問題的共性是目前的深度學習僅用到了語音信號各個頻帶的能量信息，而忽略了語音信號的相位信息，尤其是對於多通道而言，如何讓深度學習更好的利用相位信息可能是未來的一個方向。

（4）另外，在較少數據量的情況下，如何通過遷移學習得到一個好的聲學模型也是研究的熱點方向。例如方言識別，若有一個比較好的普通話聲學模型，如何利用少量的方言數據得到一個好的方言聲學模型，如果做到這點將極大擴展語音識別的應用範疇。這方面已經取得了一些進展，但更多的是一些訓練技巧，距離終極目標還有一定差距。

（5）語音識別的目的是讓機器可以理解人類，因此轉換成文字並不是最終的目的。如何將語音識別和語義理解結合起來可能是未來更為重要的一個方向。語音識別裡的 LSTM 已經考慮了語音的歷史時刻信息，但語義理解需要更多的歷史信息才能有幫助，因此如何將更多上下文會話信息傳遞給語音識別引擎是一個難題。

（6）讓機器聽懂人類語言，僅靠聲音信息還不夠，“聲光電熱力磁”這些物理傳感手段，下一步必然都要融合在一起，只有這樣機器才能感知世界的真實信息，這是機器能夠學習人類知識的前提條件。而且，機器必然要超越人類的五官，能夠看到人類看不到的世界，聽到人類聽不到的世界。

語音識別的產業歷程

語音識別這半個多世紀的產業歷程中，其中共有三個關鍵節點，兩個和技術有關，一個和應用有關。第一個關鍵節點是 1988 年的一篇博士論文，開發了第一個基於隱馬爾科夫模型（HMM）的語音識別系統—— Sphinx，當時實現這一系統的正是現在的著名投資人李開復。

從 1986 年到 2010 年，雖然混合高斯模型效果得到持續改善，而被應用到語音識別中，並且確實提升了語音識別的效果，但實際上語音識別已經遭遇了技術天花板，識別的準確率很難超過 90%。很多人可能還記得，在 1998 年前後 IBM、微軟都曾經推出和語音識別相關的軟件，但最終並未取得成功。

第二個關鍵節點是 2009 年深度學習被系統應用到語音識別領域中。這導致識別的精度再次大幅提升，最終突破 90%，並且在標準環境下逼近 98%。有意思的是，儘管技術取得了突破，也湧現出了一些與此相關的產品，比如 Siri、Google Assistant 等，但與其引起的關注度相比，這些產品實際取得的成績則要遜色得多。Siri 剛一面世的時候，時任 Google CEO 的施密特就高呼，這會對 Google 的搜索業務產生根本性威脅，但事實上直到 Amazon Echo 的面世，這種根本性威脅才真的有了具體的載體。

第三個關鍵點正是 Amazon Echo 的出現，純粹從語音識別和自然語言理解的技術乃至功能的視角看這款產品，相對於 Siri 等並未有什麼本質性改變，核心變化只是把近場語音交互變成了遠場語音交互。Echo 正式面世於2015年6月，到 2017 年銷量已經超過千萬，同時在 Echo 上扮演類似 Siri 角色的 Alexa 漸成生態，其後臺的第三方技能已經突破 10000 項。藉助落地時從近場到遠場的突破，亞馬遜一舉從這個賽道的落後者變為行業領導者。

但自從遠場語音技術規模落地以後，語音識別領域的產業競爭已經開始從研發轉為應用。研發比的是標準環境下純粹的算法誰更有優勢，而應用比較的是在真實場景下誰的技術更能產生優異的用戶體驗，而一旦比拼真實場景下的體驗，語音識別便失去獨立存在的價值，更多作為產品體驗的一個環節而存在。

所以到 2019 年，語音識別似乎進入了一個相對平靜期，全球產業界的主要參與者們，包括亞馬遜、谷歌、微軟、蘋果、百度、科大訊飛、阿里、騰訊、雲知聲、思必馳、聲智等公司，在一路狂奔過後紛紛開始反思自己的定位和下一步的打法。

語音賽道里的標誌產品——智能音箱，以一種大躍進的姿態出現在大眾面前。2016 年以前，智能音箱玩家們對這款產品的認識還都停留在：亞馬遜出了一款叫 Echo 的產品，功能和 Siri 類似。先行者科大訊飛叮咚音箱的出師不利，更是加重了其它人的觀望心態。真正讓眾多玩家從觀望轉為積極參與的轉折點是逐步曝光的 Echo 銷量，2016 年底，Echo 近千萬的美國銷量讓整個世界震驚。這是智能設備從未達到過的高點，在 Echo 以前除了 Apple Watch 與手環，像恆溫器、攝像頭這樣的產品突破百萬銷量已是驚人表現。這種銷量以及智能音箱的 AI 屬性促使 2016 年下半年，國內各大巨頭幾乎是同時轉變態度，積極打造自己的智能音箱。

未來，回看整個發展歷程，2019 年是一個明確的分界點。在此之前，全行業是突飛猛進，但 2019 年之後則開始進入對細節領域滲透和打磨的階段，人們關注的焦點也不再是單純的技術指標，而是迴歸到體驗，迴歸到一種“新的交互方式到底能給我們帶來什麼價值”這樣更為一般的、純粹的商業視角。技術到產品再到是否需要與具體的形象進行交互結合，比如人物形象；流程自動化是否要與語音結合；酒店場景應該如何使用這種技術來提升體驗，諸如此類最終都會一一呈現在從業者面前。而此時行業的主角也會從原來的產品方過渡到平臺提供方，AIoT 縱深過大，沒有任何一個公司可以全線打造所有的產品。

語音識別的產業趨勢

當語音產業需求四處開花的同時，行業的發展速度反過來會受限於平臺服務商的供給能力。跳出具體案例來看，行業下一步發展的本質邏輯是：在具體每個點的投入產出是否達到一個普遍接受的界限。

離這個界限越近，行業就越會接近滾雪球式發展的臨界點，否則整體增速就會相對平緩。不管是家居、酒店、金融、教育或者其他場景，如果解決問題都是非常高投入並且長週期的事情，那對此承擔成本的一方就會猶豫，這相當於試錯成本過高。如果投入後，沒有可感知的新體驗或者銷量促進，那對此承擔成本的一方也會猶豫，顯然這會影響值不值得上的判斷。而這兩個事情，歸根結底都必須由平臺方解決，產品方或者解決方案方對此無能為力，這是由智能語音交互的基礎技術特徵所決定。

從核心技術來看，整個語音交互鏈條有五項單點技術：喚醒、麥克風陣列、語音識別、自然語言處理、語音合成，其它技術點比如聲紋識別、哭聲檢測等數十項技術通用性略弱，但分別出現在不同的場景下，並會在特定場景下成為關鍵。看起來關聯的技術已經相對龐雜，但切換到商業視角我們就會發現，找到這些技術距離打造一款體驗上佳的產品仍然有絕大距離。

所有語音交互產品都是端到端打通的產品，如果每家廠商都從這些基礎技術來打造產品，那就每家都要建立自己雲服務穩定，確保響應速度，適配自己所選擇的硬件平臺，逐項整合具體的內容（比如音樂、有聲讀物）。這從產品方或者解決方案商的視角來看是不可接受的。這時候就會催生相應的平臺服務商，它要同時解決技術、內容接入和工程細節等問題，最終達成試錯成本低、體驗卻足夠好的目標。

平臺服務並不需要閉門造車，平臺服務的前提是要有能屏蔽產品差異的操作系統，這是 AI+IOT 的特徵，也是有所參照的，亞馬遜過去近 10 年裡是同步著手做兩件事：一個是持續推出面向終端用戶的產品，比如 Echo，Echo Show等；一個是把所有產品所內置的系統 Alexa 進行平臺化，面向設備端和技能端同步開放SDK和調試發佈平臺。雖然 Google Assistant 號稱單點技術更為領先，但從各方面的結果來看 Alexa 是當之無愧的最為領先的系統平臺，可惜的是 Alexa 並不支持中文以及相應的後臺服務。

國內則缺乏亞馬遜這種統治力的系統平臺提供商，當前的平臺提供商分為兩個陣營：一類是以百度、阿里、訊飛、小米、騰訊為代表的傳統互聯網或者上市公司；一類是以聲智等為代表的新興人工智能公司。新興的人工智能公司相比傳統公司產品和服務上的歷史包袱更輕，因此在平臺服務上反倒是可以主推一些更為面向未來、有特色的基礎服務，比如兼容性方面新興公司做的會更加徹底，這種兼容性對於一套產品同時覆蓋國內國外市場是相當有利的。

類比過去的 Android，語音交互的平臺提供商們其實面臨更大的挑戰，發展過程可能會更加的曲折。過去經常被提到的操作系統的概念在智能語音交互背景下事實上正被賦予新的內涵，它日益被分成兩個不同但必須緊密結合的部分。

過去的 Linux 以及各種變種承擔的是功能型操作系統的角色，而以 Alexa 為代表的新型系統則承擔的則是智能型系統的角色。前者完成完整的硬件和資源的抽象和管理，後者則讓這些硬件以及資源得到具體的應用，兩者相結合才能輸出最終用戶可感知的體驗。功能型操作系統和智能型操作系統註定是一種一對多的關係，不同的 AIoT 硬件產品在傳感器（深度攝像頭、雷達等）、顯示器上（有屏、無屏、小屏、大屏等）具有巨大差異，這會導致功能型系統的持續分化（可以和 Linux 的分化相對應）。這反過來也就意味著一套智能型系統，必須同時解決與功能型系統的適配以及對不同後端內容以及場景進行支撐的雙重責任。

這兩邊在操作上，屬性具有巨大差異。解決前者需要參與到傳統的產品生產製造鏈條中去，而解決後者則更像應用商店的開發者。這裡面蘊含著巨大的挑戰和機遇。在過去功能型操作系統的打造過程中，國內的程序員們更多的是使用者的角色，但智能型操作系統雖然也可以參照其他，但這次必須自己來從頭打造完整的系統。（國外巨頭不管在中文相關的技術上還是內容整合上事實上都非常薄弱，不存在侵略國內市場的可能性）

隨著平臺服務商兩邊的問題解決的越來越好，基礎的計算模式則會逐漸發生改變，人們的數據消費模式會與今天不同。個人的計算設備（當前主要是手機、筆記本、Pad）會根據不同場景進一步分化。比如在車上、家裡、酒店、工作場景、路上、業務辦理等會根據地點和業務進行分化。但分化的同時背後的服務則是統一的，每個人可以自由的根據場景做設備的遷移，背後的服務雖然會針對不同的場景進行優化，但在個人偏好這樣的點上則是統一的。

人與數字世界的接口，在現在越來越統一於具體的產品形態（比如手機），但隨著智能型系統的出現，這種統一則會越來越統一於系統本身。作為結果這會帶來數據化程度的持續加深，我們越來越接近一個百分百數據化的世界。

總結

從技術進展和產業發展來看，語音識別雖然還不能解決無限制場景、無限制人群的通用識別問題，但是已經能夠在各個真實場景中普遍應用並且得到規模驗證。更進一步的是，技術和產業之間形成了比較好的正向迭代效應，落地場景越多，得到的真實數據越多，挖掘的用戶需求也更準確，這幫助了語音識別技術快速進步，也基本滿足了產業需求，解決了很多實際問題，這也是語音識別相對其他 AI 技術最為明顯的優勢。

不過，我們也要看到，語音識別的內涵必須不斷擴展，狹義語音識別必須走向廣義語音識別，致力於讓機器聽懂人類語言，這才能將語音識別研究帶到更高維度。我們相信，多技術、多學科、多傳感的融合化將是未來人工智能發展的主流趨勢。在這種趨勢下，我們還有很多未來的問題需要探討，比如鍵盤、鼠標、觸摸屏和語音交互的關係怎麼變化？搜索、電商、社交是否再次重構？硬件是否逆襲變得比軟件更加重要？產業鏈中的傳感、芯片、操作系統、產品和內容廠商之間的關係又該如何變化？

本文得到眾多語音識別領域專家的指導，並引用了一些參考資料的配圖，在此表示感謝，本文中的不足之處還請批評指正。

參考資料

[1] W. Minhua, K. Kumatani, S. Sundaram, N. Ström and B. Hoffmeister, "Frequency Domain Multi-channel Acoustic Modeling for Distant Speech Recognition," ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brighton, United Kingdom, 2019, pp. 6640-6644.

[2] Li B, Sainath TN, Narayanan A, Caroselli J, Bacchiani M, Misra A, Shafran I, Sak H, Pundak G, Chin KK, Sim KC. Acoustic Modeling for Google Home. InInterspeech 2017 Aug 20 (pp. 399-403).

[3] Chiu CC, Sainath TN, Wu Y, Prabhavalkar R, Nguyen P, Chen Z, Kannan A, Weiss RJ, Rao K, Gonina E, Jaitly N. State-of-the-art speech recognition with sequence-to-sequence models. In2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2018 Apr 15 (pp. 4774-4778). IEEE.

[4] Li J, Deng L, Gong Y, Haeb-Umbach R. An overview of noise-robust automatic speech recognition. IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2014 Feb 5;22(4):745-77.

[5] 俞棟,鄧力. 解析深度學習：語音識別實踐. 電子工業出版社. 2016年.

[6] 韓紀慶,張磊,鄭鐵然. 語音信號處理. 清華大學出版社. 2005年.

[7] 王東. 語音識別技術的現狀與未來. 2017年.

[8] https://developer.amazon.com/zh/blogs/alexa/post/92bb9391-e930-464b-8ece-1fd8b476702a/amazon-scientist-outlines-multilayer-system-for-smart-speaker-echo-cancellation-and-voice-enhancement

[9] https://venturebeat.com/2019/04/01/alexa-researchers-develop-2-mic-speech-recognition-system-that-beats-a-7-mic-array/

[10] https://yq.aliyun.com/articles/704173

[11] http://azero.soundai.com

[12] http://research.baidu.com/Blog/index-view?id=109

文章作者介紹：

陳孝良，聲智科技創始人、董事長兼CEO，

馮大航，聲智科技聯合創始人、CTO

李智勇，聲智科技戰略合夥人、CSO

(*本文為 AI科技大本營原創文章，轉載請聯繫微信 1092722531)

福利時刻

入群參與每週抽獎~

掃碼添加小助手，回覆：大會，加入福利群，參與抽獎送禮！

AI ProCon 2019 邀請到了亞馬遜首席科學家@李沐，在大會的前一天（9.5）親授「深度學習實訓營」，通過動手實操，幫助開發者全面瞭解深度學習的基礎知識和開發技巧。還有 9大技術論壇、60+主題分享，百餘家企業、千餘名開發者共同相約 2019 AI ProCon！

距離5折優惠票結束還有4天！

分享到:

關鍵字: 語音深度語音識別

風駿7智能語音交互，讓出發更精彩！

小朋友學習的C++語音，最為大人的你又知道多少？

二十歲女聲音鑑黃師每天鑑定不良語音4000條，“任重而道遠”

不聽語音？讓你下輩子變成一個不識字的人

微信好友刪除怎麼找回

RNG對於本次S8的表現，向大家誠摯致歉，並放出第五局隊內語音

「語音」互聯網時代來臨智能家電大有可為

快手大網紅語音騾子與同門師妹內訌，師父仙洋深夜發文話有所指！

腦陸科技：語音，圖像，意念，機器學習的下一個決勝賽道

購買Reno的第7個理由：想做什麼，用語音助手就搞定

你還在低效辦公？訊飛飛鼠，讓語音智能鼠標帶你玩出辦公新花樣

你不知道的移動從今天開始

微信怎麼也沒想到會突然出現個子彈短信，上市7天榮登App免費榜首

科大訊飛首現季度虧損多產品毛利下降行業天花板已現？

RNG道歉語音作假？英雄聯盟貼吧公開質疑，這一細節十分關鍵

QQ、微信上的寒暄，不如見一面來的實在

獅航客機失事189人遇難駕駛艙語音記錄器被找到

IG語音曝光，阿水五殺後的表現讓粉絲感慨：他真的不容易

請直接跟我打電話不要發微信了

科大訊飛在遵義成立大數據公司，註冊資本3000萬人民幣

你收到微信不能使用語音視頻的通知了嗎？

騰訊王卡福利二選一即將更新：新用戶每3個月申請一次

太難了！確認過語音？但還是被騙了

華航空難後“鬼來電瘋傳”，接起後男聲淒厲哭：我不要死在這

AI芯片市場2026年將破700億美元！邊緣計算複合年增長率超40%

語音控制互動技術原理

喜馬拉雅扶持"新藍海"：10億流量打造100家過千萬聲音工會

國產手機發展史（38）：金立手機（上）

科大訊飛致力人工智能持續深耕智能市場

新東方英語雙師課堂火爆了，原來是用了這款語音答題器

開口紅語音口令紅包bug 朋友圈所有紅包通通入囊不看普通話等級

QQ再次宣戰微信 QQ大更新推出語音進度條騰訊內戰誰能笑道最後

智能家居的入口——小度語音為你帶來科技絢麗的生活體驗

支付寶如何設置語音提示：您支付寶到賬xxx元？

員工群回覆ok手勢被開除：懂得這些微信禮儀，你的職場會更順

大匯物聯開發智能大屏語音助手

LEO02智能語音檯燈體驗，智能語音讓學習和工作更便捷

38歲的生日願望李宗偉盼疫情消失所有人都健康

5G時代能為用戶提供更多權益的才是真5G套餐

VOLTE:能夠讓你同時通話上網

Breeno，幫我還一下花唄。

到手69元！蘇寧智能耳機首發：防水降噪續航10小時

語音、意念、肌肉信號？無人機操控解鎖多種新玩法

為什麼通訊錄好友那麼多，卻沒人可以幫你解決問題！

語音、詞彙、語法適當集中循環教學方法在高中英語教學中的應用

小米電視4S 75英寸史低：跌破4000 發佈價已腰斬

科目一科目四一秒一題語音答題技巧學會技巧輕鬆考證

rng道歉語音你怎麼看？

IoT的冤屈！我真的不是小愛同學！不是語音控制

女上司發語音問睡了沒，我手欠回覆：還沒有，結果...

潛逃壓力過大暴瘦40多斤，一涉黑A級通緝犯在河北投案自首

記者從河北省公安廳獲悉，日前公安部通緝的13名A級通緝犯中的2號通緝犯魯某某近日向河北邯鄲警方投案自首，這是公安部A級通緝令後又一通緝犯主動投案。

當我們在談 SaaS 的時候，在談什麼？

當我們在談SaaS 的時候，在談什麼？什麼是 SaaSSaaS 優缺點SaaS 銷售模式SaaS 產品指標SaaS 業務指標SaaS 收入計算一、什麼是 SaaS這個模式讓軟件變得和水電氣很相似，只需要每月繳納固定的費用即可享受服務。

合同詐騙的類型有哪些？企業無力償還借款是否構成合同詐騙罪？

現階段，隨著國家供給側結構性改革的不斷深入，人們在市場中的互易行為日益頻繁，合同在經濟活動發揮的作用也日漸凸顯。

5月西安招聘會時間安排來了！找工作的別錯過

乘車路線:西安市內乘坐12路、14路、14路區間、26路、215路、215路區間、216路、224路、229路、239路、31路、36路、321路、323路、521路、600路、603路、616路、701路、704路、709路、教育專線、K605路、K616路、遊6路、遊8路61

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

全球鬧「美元荒」帶動穩定幣需求暴增！以太坊交易量創近兩年新高

基於以太坊區塊鏈的主要穩定幣包括：Tether、TrueUSD、GeminiDollar、Paxos Standard、Binance USD、USD Coin、Huobi USD和MakerDAO等。

“幫助當地居民解決用水難題”-今日頭條-手機光明網

晨曦初露，9歲的米格爾和弟弟妹妹們抱著水罐，穿過一片田野，到達安哥拉首都羅安達郊區的指定取水點。葛洲壩安哥拉有限公司市場部負責人劉世軒介紹說，公司每天派出送水車兩次，一次3車，將潔淨水從羅安達水廠直接運往指定取水點。

灌籃高手無水印壁紙，每一張都是回憶

那些年，我們追過的灌籃高手，你更喜歡誰呢？流川楓櫻木花道赤木剛憲宮城良田三井壽你喜歡哪個球員呢？歡迎評論區留言。

通遼藍天救援隊成功解救遼河公園水上被困群眾

2020年5月1日，通遼藍天救援隊假期例行在遼河公園水域進行安全巡邏任務，下午15時10分，巡邏隊員發現遼河水面有被困群眾向巡邏船隻求救，接到求救信號後，巡邏隊員緊急前往事故現場展開研判、救援準備工作。

5月6日·武漢要聞及抗擊肺炎快報

今天零時起高速公路恢復收費了，這些車輛還能免費5月6日零時起全國高速公路恢復收費在武漢北收費站ETC和人工車道全部可通行零時左右通過收費站的車輛並不多以大貨車為主有工作人員在一旁引導貨車進入高速收費站前要通過入口稱重檢測車道進入沒有超重超限便可順利通過現場沒有出現排隊的現象全省聯

肖副省長等省市領導到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作

2020年4月29日下午，肖副省長等省市領導來到孝感市楚澴中學調研九年級復學暨疫情防控常態化工作，肖副省長等省市領導在學校領導陪同下，重點對校門口出入、保健室、教室、學生心理輔導室、洗手池等進行了非常細緻的檢查，對孝感市楚澴中學的復學和疫情防控工作給予充分的肯定。

相聲界的顏值擔當張雲雷稱號大揭祕

這個播放量就連師傅身為相聲演員的張雲雷卻有著堪比娛樂圈小鮮肉的顏值，一個相聲演員長成這樣，張雲雷不火誰能火。

美國百年薅羊毛攻略

當德國向法軍陣地傾洩400多萬發炮彈，揚言要讓凡爾登成為「碾碎法軍的絞肉機」時，遠在大西洋的美國人。

《全職高手》：一口氣刷了10集，對楊洋路轉粉了

近日，由楊洋、江疏影主演的劇版《全職高手》在騰訊視頻正式開播了，該劇改編自蝴蝶藍同名小說，先前還被改編成動畫版。

共同承擔責任！Rookie談BP問題：輸了是我們打得太臭

前言：IG這隻老牌戰隊在我們LPL賽區以來都擁有著非常高的人氣，特別是在2018年之後，他們幫助我們LPL賽區奪得了第一個寶貴的S賽世界冠軍，而IG戰隊的打法一直以來也是非常有觀賞性的。

LOL"中韓對抗賽"遭選手反對？Zoom直言不想打，Doinb的回答太真實

Doinb表示："可以的話我不想參加，首先這場比賽沒有任何意義，獲得勝利既不會有獎金也不會有榮譽，但萬一輸掉比賽FPX就會成為大家吐槽的焦點"。

李亞鵬攜李嫣出席慈善晚會，李嫣手上鑽戒搶鏡，1個動作獲誇讚！

大家都知道天后王菲和前夫李亞鵬他們育有一個女兒，名叫李嫣。於是李嫣因為偷偷的開了直播從而也導致了她被大家所發現，但李嫣的樂觀和開朗卻也讓李亞鵬放下心來，決定放飛女兒，讓她自由的去探索她想要的世界。

53歲郭富城再度升級當爸，方媛懷二胎，Chant要做姐姐了

天王郭富城近日參加活動，首度承認妻子方媛懷有二胎的消息。從去年2017年兩人結婚，低調的愛情讓媒體都捕捉不到邊際，天王嫂31歲兩人相差了20歲的愛戀，始終不少人不看好啊。

那些拼命的演員：王寶強喝了一大桶牛奶，孫儷吃10斤瓜子

演員在我們眼中一直都是光鮮亮麗、收入頗高的職業，並且現在有很多靠流量躋身一線，卻毫無演技以及實力的演員。

賈乃亮用上了“一米陽光”這個詞，他依然渴望擁有美麗的愛情！

曾經賈乃亮是“陽光”的代名詞，大家看到他都覺得很暖，只不過後來就不是了。今天早上，他發了一條微博“人生的美好就是每天醒來都能看到上帝賜予我的那一米陽光”，這句話當中，賈乃亮用到了“一米陽光”這個詞。

搞笑GIF開心一刻：我的老家農村，有妹子願意嫁給我嗎？

當一名理髮師也不容易這是一隻有航天夢想的老鼠寶寶！什麼？這麼貴！把我賣了得了。小朋友，你贏了，我甘拜下風！

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

程瀟身材多好？雙腿劈叉才明白，這才是“腿精”

程瀟可謂是才女，她是中韓宇宙少女的成員之一，今年她只有20歲。不要看程瀟年紀比較小，但是她身材還是挺好的，身材也是典型S型曲線，魅力不小。

張柏芝承認三胎產子，否認小夥的老爸是孫東海，看來她選擇保密

張柏芝是許多80後90後心目中的女神，除了顏值高有演技外，她和謝霆鋒的婚姻和戀情也曾是吃瓜群眾津津樂道的事。

T1戰隊搶注Faker商標，“囊括多個領域產品，商業潛力媲美喬丹”

前言：目前各大賽區的春季賽都已經結束了，T1戰隊在重組之後再度拿下了lck賽區的冠軍，這讓很多的玩家非常意外，這也從側面反映出來了，核心選手和主教練的個人能力，同時faker的實力再度被玩家們認可，最近一段時間他也是一直在直播，很多的人都在詢問，今年李哥的目標是什麼？

雲頂之弈“最不平衡的版本”誕生，全員搶一費卡，運氣成吃雞關鍵

上線之後迅速引發了大量玩家的好評，就在最近，官方也是迎來了10.9版本，可是在目前的版本中再度出現了太多的畸形玩法了，應該是有史以來最不平衡的版本，因為一費卡的爆率大大提升，導致遊戲成為了三星的天下，全員搶一費卡，運氣成為吃雞的關鍵。

LPL春季賽"6宗最"：Uzi最遺憾，阿水最驚喜，V5最離譜

在本期節目中會評選出一位最美麗LPL女解說，其中瞳夕、Rita、餘霜等都在名單之中，最有趣的是管澤元居然也出現在了“女解說”名單中，全因餘霜一張P過的照片，論梗的話，管澤元第一，若是輪顏值，估計這也排不上名次。

雷佳音被問：跟佟麗婭拍那麼多親熱戲是啥感受？他的回答笑翻眾人

不過要是像唐嫣和羅晉那樣用公費談戀愛的故事不多，大多數還是和不是心愛的人拍得多，但要是遇上岳雲鵬和佟麗婭拍親熱戲的話，那個畫面或許大家想象不出來吧。

JDG成最“慘”冠軍戰隊？拿到LPL冠軍人氣依舊低迷，TES成贏家！

LPL賽區的春季賽結束也有一段時間了，作為冠軍戰隊JDG，並沒有因為拿到冠軍而出現“人氣”的高漲，依舊平平淡淡，熟悉LPL賽區的玩家都知道，在LPL賽區中，一直以來都是由RNG、IG、EDG三家從“遠古”時期就開始統治LPL賽區，期間也有OMG和LGD、WE幾個戰隊打破了這個規律

#戰疫必勝#“症和狀”都有了，我與新冠擦肩而過

學習結束，回到家後，在武大短暫學習的那段時光時常讓我懷念，並曾立下誓言，抽個暑假一定要帶著老婆孩子一起去“逛”武大。機會就這麼悄然而至！2019年第28屆世界腦力錦標賽全球總決賽的舉辦地就是武漢，比賽的日期是12月6日到8日，三天的時間。其實，我也沒有想到第一次參加這樣比賽的女兒

T1提議中韓友誼賽，但LPL隊伍都不想參加？理由其實很簡單

這不今天就有網友在論壇中聊起了這個話題，有網友表示“LPL隊伍其實都不想參加中韓友誼賽，LPL隊伍才剛結束春季賽，18天之後就要打夏季賽了，像IG可能會有人員變動FPX TES 應該也會利用這段時間來檢討分析，也許只有JDG 比較願意參加，doinb只是第一表態的選手，可能還有很

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽

網友投稿：光山縣潑陂河鎮至白雀園鎮的X015縣道德兩座壞橋經過5個月的等待終於開修啦#光山 #信陽，於2020年04月28日上線，由信陽本地聯盟上傳。西瓜視頻為您提供高清視頻，畫面清晰、播放流暢，看豐富、高質量視頻就上西瓜視頻。

2020最佳韓劇追起來~《愛的迫降》僅排名第二，TOP 1絕對實至名歸

TOP20 - 「優雅的家」這部由林秀香、李章宇、裴宗玉等人所主演的《優雅的家》，當時一播出就引起不少話題，雖然劇情有點浮誇，但卻莫名好看，而當時該劇還刷新了MBN電視臺的記錄呢~《優雅的家》主要講述一位擁有完美外貌和身材的MC集團獨生女毛碩熙，為了查明15年母親去世的真相，因此

搞笑GIF開心一刻：我正在睡覺，誰敢打擾我

我這暴脾氣，等你剝完我能吃五個你帶著你家貓去做演員吧！這貓太有前途了！這是我見過最牛的啦啦隊！自從有了弟弟，老大就和家務結緣了狼狗：要不是主人在，我非吃了你兩個小子！

備考消防的幾大錯覺，你有這個情況嗎？

講真，很多時候我們會把事情想當然，並因為這些錯覺而採取錯誤的舉動，一消備考是一場毅力和心智的戰鬥，大家難免會產生一些錯覺，從而影響自己的備考效率，甚至導致備考失敗。

“頂流”李敏鎬啞火，渣男出軌劇出圈，韓劇觀眾也長大了？

豆瓣開分8.3，漸漸跌到7.7分，熱門短評寫道：“同樣是金編，差距怎麼這麼大”、“看了四集節奏真的是一團糟，比起隔壁《夫妻的世界》真的差一大截”。

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

應急科普丨“五一” 期間氣溫回升謹防森林火災隱患

隨著“五一”期間氣溫大幅回升全國大部分地區已經進入初夏在享受小長假春日美景的同時森林火險等級也隨之明顯提升新疆森林消防提示您春季氣溫回升快野外草木乾燥你的一個失當用火行為就有可能引發森林大火勿念蔥林繁似海一星燃盡只塵埃

搞笑GIF開心一刻：拍照啦，趕緊看鏡頭

弟弟：姐姐你能利索點嗎家裡有個熊孩子，說實話心很累同學感覺你好可伶，一個人跳舞多尷尬啊！看我病好了怎麼收拾你們！真的是以迅雷不及掩耳之勢啊。姑涼，你……掉毛啊！小姐姐你是想找男朋友嗎用這樣的方式，結局很意外此處注意安全！

工程發承包、工程造價條款，或迎來大調整

第二章建設規劃與設計第一節建設規劃第八條建設規劃的體系第九條建設規劃的編制與審批第十條建設規劃的內容第十一條建設規劃的實施與評估第二節城市設計第十二條城市設計的基本要求第十三條城市設計的編制和審批第十四條城市設計的實施和管理第三節建築設計第十五條建築設計的基

新增四省！關於2019年一級建造師考試證書、複核發佈公告

快來看看吧~青海關於恢復專業技術人員職業資格證書的發放、補辦工作的通知各位考生：隨著疫情防控進入常態化，青海省新冠疫情得到有效控制，專業技術人員職業資格證書的印製、發放工作正在逐步恢復，為方便廣大考生辦理證書業務，4月28日起青海省人力資源和社會保障服務中心一樓大廳65、66號辦

學霸也會復讀？朱廣權這個圈粉無數的國民段子手是如何煉成的！

“煙籠寒水月籠沙，不止東湖與櫻花，門前風景雨來佳，蓮藕魚糕玉露茶，鳳爪藕帶熱乾麵，米酒香菇小龍蝦，守住金蓮不自誇，趕緊下單買回家，買它買它就買它，熱乾麵和小龍蝦。”

幸福的人，總會忘記舊愛

幸福從來不可能是有個人幫你搞定所有的一切，而你只需要坐享其成。她喜歡喝銀耳蓮子羹而且必須是上好的銀耳，用小火慢慢燉到砧稠那一日，他去看她，她冷冷地從屋裡走出來，丟給他一本書.對他說:"廚房裡小鍋燉著東西，你幫我去看看。”他真真地守了一個多小時，端到她面前。

真人芭比：一直說自己“沒整容”最後晒出舊照，打臉的卻是自己

俗話說的好“愛美之心人人都有”而讓自己快速變美的方法無疑就是“整容”如今的社會整容看起來似乎很平常。

驚了！這件事沒有做，一消證書等於白考！

不要慌，同學們，遇到問題不要怕，拿到證書不去註冊，相當於證書無效，今天就為大家一一解答註冊證書的相關問題。

8年後，有哪些人會留在農村生活？以下4類人群或將留下，有你嗎

從九十年代末開始，在我國農村地區就興起了一股“進城潮”，記得那個時候，農村的經濟發展相對滯後，村民生活條件艱苦，鄉親們為了擺脫貧困，只能告別親人，遠離家鄉去外面打拼賺錢。

唯一回絕張藝謀力捧的女生，被報送上清華，25歲有上百億身家

25歲有上百億身家文/娛樂深扒爆姐圖/網絡張藝謀是一位非常有實力的導演，同時非常出名，而且他拍攝的作品中有不少獲獎無數的經典影片，同時也捧紅過不少藝人。

疫情下的悲劇：買不起手機上網課，那個女孩決定吞藥自殺

有人為了生計不顧自身安危，有人躲在家中安然度日，還有人僅僅因為一個手機，就要放棄自己的生命...這個女孩，今年上初三，因為疫情的原因，全國各地都展開了網課線上教育，女孩的學校也不例外。

李棟旭劉仁娜新劇開拍，互對臺詞歡樂多，終於要開始撒狗糧了嗎？

這部劇是2016年年底播出的，熱度一直持續到了2017年，相關的周邊和景點都相當熱門，像是池恩卓跟鬼怪大叔相遇的海邊、劇中出現的鬼怪玩偶、還有鬼怪大叔的拔劍特效等等。

高考延期：七月的高考，最熱的天，做最難的題！

後來，由於7月份氣候較差，極端天氣頻發，尤其是南方地區，要麼極端高溫，要麼就是颱風，對於高考來說非常不友好，不僅考生的考試質量會下降，而且閱卷老師、高考工作者也不方便，因此，從2003年開始，高考日期都固定在了每年的6月7日、8日。