12.05 「行業報告」人工智能行業研究報告

一、什麼是人工智能

人工智能(Artificial Intelligence),英文縮寫為AI,是達特茅斯大學助理教授John McCarthy在1956年提出的。但是,對於人工智能的定義一直沒有統一的觀點,不同的學者和研究人員根據不同的語境和關注的角度提出了多種對於人工智能的定義。

筆者根據多年的投資經驗以及對人工智能項目的實地盡調,認為人工智能是指使用機器代替人類實現認知、識別、分析、決策等功能,其本質是對人的意識與思維的信息過程的模擬。而我們在衡量人工智能能力的時候,必然涉及到三方面的能力,即計算能力、感知能力、認知能力。

「行業報告」人工智能行業研究報告

其中,計算能力是指機器快速計算和記憶存儲能力。在計算能力方面,計算機已遠遠超過人類的計算和存儲能力;感知能力,是解決機器聽到看到問題,一般指視覺、聽覺、觸覺等感知能力,在技術層面,一般認為語音識別、圖像識別等技術屬於感知智能的領域;認知能力,解決機器聽懂看懂的問題,通俗講是“能理解、會思考”。


二、國內AI市場概況

(1)技術層面,計算機視覺是當前熱點,芯片和算法等底層會是未來方向

「行業報告」人工智能行業研究報告

通過上圖我們可以發現,近幾年,國內AI行業高速發展,環比增速在45%左右,預計到2020年,整個國內的AI市場容量將達到710億元,說完了整體市場容量,筆者再帶大家看下當前人工智能市場的技術規模結構:

「行業報告」人工智能行業研究報告

其中各個技術板塊的主要技術應用分別如下:

  • 語音:語音識別、語音合成、語音交互、語音評測、人機對話、聲紋識別;
  • 計算機視覺:生物識別(人臉識別、虹膜識別、指紋識別、靜脈識別)、情感計算、情緒識別、表情識別、行為識別、手勢識別、人體識別、視頻內容識別、物體和場景識別、計算機視覺、機器視覺、移動視覺、OCR、手寫識別、文字識別、圖像處理、圖像識別、模式識別、眼球追蹤、人機交互、SLAM、移動視覺、空間識別、三維掃描、三維重建 ;
  • 自然語言處理:自然語言交互、自然語言理解、語義理解、機器翻譯、文本挖掘(語義分析、語義計算、分類、聚類)、信息提取、人機交互;
  • ML/DL 算法及平臺:機器學習、深度學習、算法平臺 ;
  • 基礎硬件:芯片、高清圖傳設備、激光雷達、傳感器、服務器。

從餅狀圖,可以看到,目前國內人工智能技術,主要在感知智能,感知智能正在突飛猛進,技術成熟度相對較高,而對於認知智能(自然語言理解等),仍然需要進一步的發展。

(2)應用層面, “AI+”和智能機器人佔據主導

「行業報告」人工智能行業研究報告

通過上圖,我們可以發現現在在應用層面上,AI+的應用佔比最大,達到40%,其次是智能機器人,達到27%,各個產業具體應用如下:

  1. 智能機器人(含解決方案):工業機器人(側重生產過程,如搬運、焊接、裝配、碼垛、噴塗等)、行業服務機器人(應用於銀行、餐廳、酒店、商場、展廳、醫院、物流)、個人/家用機器人(虛擬助理、情感陪伴機器人、兒童機器人、教育機器人、家庭作業機器人(掃地、擦窗等)、家用安防機器人、車載機器人);
  2. 智能駕駛(含解決方案):智能駕駛、無人駕駛、自動駕駛、輔助駕駛、高級駕駛輔助系統(ADAS)、激光雷達、超聲波雷達、毫米波雷達、GPS 定位、高精度地圖、車載芯片、人車交互、車聯網;
  3. 無人機(含解決方案):消費級無人機(娛樂、航拍) 工業無人機(農林、電力、物流、安防等領域);
  4. 大數據及數據服務:數據可視化、數據採集、數據清洗、數據挖掘、數據解決方案。

在AI+方面,當前AI和具體行業或場景的結合情況如下,其中最主要的場景分別為金融、製造、電商、醫療等。

「行業報告」人工智能行業研究報告

數據來源:2017 CSDN中國開發者大調查

(3)融資層面,融資金額逐年提高,單筆金額逐漸增大

「行業報告」人工智能行業研究報告

數據來源:IT桔子 2012-2017AI融資趨勢

從2012年至今,我國AI領域共有1354家公司,投資事件1353起,投資總額為1448億人民幣。2012年,我國的AI投資事件共26起,投資金額為6億元人民幣,到了2017年,投資事件已經高達334起,投資總額已經超過550億元人民幣,相比2012年翻了上百倍。不過,相對2016年,2017年的投資事件有所下降,但是投資總額大幅上升,資本對於AI的熱情還是值得肯定的。

三、人工智能發展背景

1. 人工智能發展史

「行業報告」人工智能行業研究報告

從1956年提出概念,到2016年大規模爆發,在這60多年裡,人工智能一共經歷了三起二落,在1970年和2000年,人工智能的發展陷入了低谷,原因主要是:

  1. 當時的算法和科技水平無法滿足人工智能的需求,最後也都是依靠算法的進化和計算能力的提升而突破。
  2. 人工智能的應用達不到人們的預期,政府縮減投入。

當前,人工智能正處於第三次熱潮。這次熱潮除了結合技術以及算法的提高之外,最大特點是通過深度學習和大數據的結合,使得人工智能在多個領域找到了真實的應用場景,與具體業務場景相結合,開始在一些行業中發揮著巨大的作用。

2. 人工智能發展三要素

如果用一個公式來概括人工智能發展受那些因素影響,那麼這個公式可以是AI=算力+算法+數據,關於這三者的關係,著名人工智能專家吳恩達曾有一個著名的比喻:發展人工智能就像用火箭發射衛星,需要強有力的引擎和足夠的燃料,如果燃料不夠,火箭無法將衛星推到合適的軌道;如果引擎推力不夠,火箭甚至都不能起飛。而這當中,算法模型就好像引擎,高性能的計算機是打造引擎的工具,海量的數據就是引擎的燃料。

(1)算力,主要包含芯片+超級計算機+雲計算

「行業報告」人工智能行業研究報告

FLOPS是Floating-point Operations Per Second每秒所執行的浮點運算次數的英文縮寫,它是一個衡量計算機計算能力的量,計算機每秒執行的浮點運算次數越多,算力越強,1GFLOPS (gigaFLOPS) =每秒10億 (=10^9) 次的浮點運算。

注:浮點運算能力大小:

  • 1MFLOPS (megaFLOPS) =每秒1百萬 (=10^6) 次的浮點運算
  • 1GFLOPS (gigaFLOPS) =每秒10億 (=10^9) 次的浮點運算
  • 1TFLOPS (teraFLOPS) =每秒1萬億 (=10^12) 次的浮點運算
  • 1PFLOPS (petaFLOPS) =每秒1千萬億 (=10^15) 次的浮點運算

(2)算法

「行業報告」人工智能行業研究報告

傳統神經網絡的時候,由於技術能力的限制,人工智能在很多行業都沒法具體應用和落地,深度神經網絡出現之後,人工智能的技術能力有了飛速的提升。

以計算機視覺為例:其主要識別方式發生重大轉變,自學習狀態成為視覺識別主流,機器從海量數據庫裡自行歸納物體特徵,然後按照該特徵規律識別物體。圖像識別的精準度也得到極大的提升,從70%+提升到95%。

(3)數據

「行業報告」人工智能行業研究報告

2017年全球人口有75億,一個人,一年產生的數據量大約是52GB的信息, 雖然作為個體的我們的確非常的渺小,但是整個人工智能的發展也離不開我們每一個人的貢獻,因為我們每個人無時無刻都在給AI輸送著燃料。

四、人工智能的產業鏈分析

「行業報告」人工智能行業研究報告

「行業報告」人工智能行業研究報告

人工智能從底層到應用層,大致可以分為技術支撐層,基礎應用層和方案集成層,下面筆者會對每塊內容,做個說明。

1. 技術支撐層

(1)芯片

1)芯片分類

芯片一般是指集成電路的載體,由晶圓分割而成,芯片按照功能不同可分為很多種,有負責音頻視頻處理的,有負責圖像處理的,還有負責複雜運算處理的,算法必須藉助芯片才能夠運行,不同場景及技術,對於芯片的性能要求也不一樣。當前大家接觸比較多的芯片應該就是CPU和GPU了。

CPU 基於高通用、強邏輯的設計—偏認知能力的應用

CPU需要很強的通用性來處理各種不同的數據類型,在大規模並行計算能力上極受限制,而更擅長於邏輯控制。核心:存儲程序,順序執行。

GPU是基於大吞吐量、高併發設計—偏感知能力的應用

和通用類型數據運算不同,GPU擅長的是大規模併發計算,這也正是密碼破解等所需要的。

CPU和GPU的區別:

舉個栗子:一個數學教授和100個小學生PK。

  • 第一回合,四則運算,100道題。教授拿到卷子一道道算,一百個小學生各拿一道題各自算,教授剛開始算到第5題的時候,小學生集體交卷,第一回合小學生碾壓教授。
  • 第二回合,證明題。一道題,當教授搞定後,一百個小學生還不知道在幹嘛…….
  • 第二回合,教授碾壓一百個小學生,這就是CPU和GPU的淺顯比較。

高通用:除了四則運算、還可以有證明題、幾何體、微積分題等等。

強邏輯:證明題,證明過程上下是有邏輯的,單獨抽出來看一行是沒有意義。

高併發:一下子100道題。

因為CPU的架構中需要大量的空間去放置存儲單元和控制單元,相比之下計算單元只佔據了很小的一部分,所以它在大規模並行計算能力上極受限制,而更擅長於邏輯控制。這方面,GPU剛好相反,但GPU無法單獨工作,必須由CPU進行控制調用才能工作。CPU可單獨作用,處理複雜的邏輯運算和不同的數據類型,但當需要大量的處理類型統一的數據時,則可調用GPU進行並行計算。

「行業報告」人工智能行業研究報告

2)芯片上下游產業鏈情況

不同的芯片在不同的算法及應用場景下,功能和價值是不一樣的,原因主要和集成電路設計的結構有關。

「行業報告」人工智能行業研究報告

晶圓:芯片是半導體,主要材料是硅,製作硅的工藝,較小、較薄,節省材料,單位材料下可以做更多芯片。

專業封測:封裝材料塑料、陶瓷、玻璃、金屬等,完成封裝後,便要進入測試的階段,在這個階段便要確認封裝完的 IC 是否有正常的運作,正確無誤之後便可出貨給組裝廠。

在芯片產業鏈上,越接近上游,附加值越高,技術門檻越大,資本投入的效益也越高。當前在芯片這塊,Intel、IBM、三星這幾家巨頭企業在芯片上下游的工藝全有,整體產業鏈控制力強,而國內的中興集團在通訊設備和手機這塊,大量和核心元器件是從國外進行採購,一但發送貿易摩擦,很容易被國外掐斷這塊原材料的供應,比較容易受制於人。

3)未來, AI定製芯片必為趨勢

任何一種產品或者商業模式在她剛出來的時候,當對於她在哪個行業具備較大經濟價值的時候,通常都是先做通用化,然後再做垂直化,通過垂直化的服務優勢,來提升整個產品以及商業模式的核心競爭力。按照上文所述,CPU和GPU都是較為通用的芯片,但是,隨著行業的快速發展,人們對於芯片的個性化要求也越來越高,萬能工具的效率永遠比不上專用工具。

人工智能領域作為一個數據密集的領域,傳統的數據處理技術難以滿足高強度並行數據的處理需求。為解決此問題,繼CPU和GPU之後,相繼出現了NPU、FPGA、DSP等專門針對AI的芯片。

TPU—用於加速深度學習運算能力而研發的一款芯片

代表公司GOOGLE

原來很多的機器學習以及圖像處理算法大部分都跑在GPU與FPGA(半定製化芯片)上面,但這兩種芯片都還是一種通用性芯片。所以在效能與功耗上還是不能更緊密的適配機器學習算法,TPU與同期的CPU和GPU相比,可以提供15-30倍的性能提升,以及30-80倍的效率提升。

NPU— 即神經網絡處理器,利用電路模擬人類的神經元和突觸結構

代表公司寒武紀

專門高效地進行 AI相關計算定製的處理器,就像GPU之於圖形處理相關的計算,ISP之於成像相關的計算。NPU性能達到了1.92TFLOP,使用NPU計算比使用CPU計算要高出25倍的速度,50倍的能效比。

4)國內芯片企業介紹

「行業報告」人工智能行業研究報告

(2)算法模型

筆者前面說了很多關於人工智能的介紹以及分析,那麼到底怎麼樣才是智能,也就是人工智能的核心是什麼,在筆者看來無非四個字——機器學習。

機器學習是需要算法來支持的,算法的作用:對數據進行歸納和演繹,最終目的是提高識別效率和準確率 ,然後對真實世界中的事件做出決策和預測。人工智能的核心就是通過不斷地機器學習,而讓自己變得更加智能。

「行業報告」人工智能行業研究報告

那什麼又是機器學習呢?

機器學習是讓計算機有能力在不需要明確編程的情況下,用大量的數據來“訓練”,從數據中學習如何完成任務。在深度學習出現之前,機器學習領域的主流是各種淺層學習算法, 如神經網絡的反響傳播算法(BP算法)、支撐向量機(SVM)、 Boosting、Logistic Regression等。這些算法的侷限性在於對有限樣本和計算單元的情況下對複雜函數的表示能力有限,對複雜數據的處理受到制約。

1)深度學習是通過模擬大腦結構的多層神經網絡進行學習

大腦中的神經元,又稱神經細胞,是構成神經系統結構和功能的基本單位,它由細胞體和細胞突起構成,每個神經元有好幾個數突,只有一個軸突,可以把興奮從胞體傳送到另一個神經元或其他組織,如肌肉或腺體。

「行業報告」人工智能行業研究報告

但與大腦中一個神經元可以連接一定距離內的任意神經元不同,人工神經網絡具有離散的層,每一次只連接符合數據傳播方向的其它層。

深度學習的“深度”指的就是多層神經網絡的層數較多,模型結構的深度,通常有5層、6層,甚至10多層的隱層節點,每層相當於一個可以解決問題不同方面的機器學習。利用這種深層非線性的網絡結構,深度學習可以實現複雜函數的逼近,將表徵輸入數據分佈式表示,繼而展現強大的從少數樣本集中學習數據集本質特徵的能力,並使概率向量更加收斂。

「行業報告」人工智能行業研究報告

2)深度學習的出現,使得人工智能在很多行業具備了價值實現的可能性

深度學習出現之後,計算機視覺的主要識別方式發生重大轉變,自學習狀態成為視覺識別主流。即,機器從海量數據庫裡自行歸納物體特徵,然後按照該特徵規律識別物體。圖像識別的精準度也得到極大的提升,從70%+提升到95%,在醫學影像領域,95%的精度識別已經具備一定使用價值,而精度識別達到達到97%以上後,將具備輔助診斷價值。

「行業報告」人工智能行業研究報告

「行業報告」人工智能行業研究報告

3)目前深度學習框架的開源已經成為了趨勢

機器學習和深度學習是需要靠算法支撐的,算法是需要不斷的利用數據進行訓練和優化。自從深度學習取得突破性進展以後,巨頭們頻頻開源,當AI公司們使用開源平臺進行算法的迭代時,開源平臺可以獲取數據,以及市場對應用場景熱度的反饋,加速模型的訓練。

在這樣的背景下谷歌公司於2015年2月15日開放了TensorFlow1.0版本。在深度學習加速發展的今天,代碼和數據庫都在迅速的更新中,開源所構建的開發者生態是極為重要的。

「行業報告」人工智能行業研究報告

「行業報告」人工智能行業研究報告

4)算法和基礎應用技術的關聯

「行業報告」人工智能行業研究報告

上圖是筆者根據自身投資行業經驗以及理解,做得一個人工智能算法對於基礎應用技術的一個難易程度關聯,場景化程度越高,對於算法難度的要求也會也會越大。

2. 基礎應用層

「行業報告」人工智能行業研究報告

(1)語音識別

技術原理:

所謂語音識別,是將聲音信號轉化成數字信號,然後通過特徵提取,進行歸納演義,推測出對應的文字,語音識別的主要難度主要在兩個方面

首先是數據的獲取、清洗。語音識別需要大量細分領域的標準化語料數據作為支撐,尤其是各地方言的多樣性更是加大了語料蒐集的工作量。

第二個難點是語音特徵的提取,目前主要通過具備多層神經網絡的深度學習來解決,多層的神經網絡相當於一個特徵提取器,可對信號進行逐層深化的 特徵描述,最終從部分到整體,從籠統到具象,做到最大程度地還原信號原始特徵。

「行業報告」人工智能行業研究報告

應用場景:

「行業報告」人工智能行業研究報告

投資價值及機會:

語音識別雖市場龐大但已出現寡頭,留給創業公司的機會不多,據Research and Markets研究報告顯示,全球智能語音市場將持續顯著增長,預計到2020年,全球語音市場規模預計將達191.7億美元。根據Capvision報告顯示,從語音行業市場份額角度來看,全球範圍內,由Nuance領跑,國內則是科大訊飛佔據主導地位。

「行業報告」人工智能行業研究報告

「行業報告」人工智能行業研究報告

以科大訊飛為例,截止2018年

1)開放平臺

訊飛開放平臺開發者達51.8萬(同比增長102%),年增長量超過前五年總和;應用總數達40萬(同比增長88%),年增長量超過前五年總和;平臺連接終端設備總數累計達17.6億(同比增長93%)。科大訊飛當前將語音識別很多功能模塊SDK化,根據開發者終端APP或者是設備每月的數據併發數來進行收費。

2)語音識別準確率

當前語音識別準確率達到98%以上,基本能夠滿足大量的的業務場景和需求。

3)智能教育、政法、城市服務程度很深

初創公司想在這三個行業和科大訊飛競爭很難。

(2)語義識別

技術原理:

語音識別解決的是計算機“聽得見”的問題,而語義識別解決的是 “聽得懂”的問題。自然語言處理(NLP)通過建立計算機框架來實現該語言模型,並根據該語言模型來設計各種實用系統,根據統計學原理推算出用戶想表達的意思,對用戶行為進行預測,然後給出對應的指令或者是反饋。

當前,NLP技術瓶頸主要還是在語義的複雜性,包含因果關係和邏輯推理的上下文等,現在解決這些問題的思路主要還是依賴於深度學習。

「行業報告」人工智能行業研究報告

應用場景:

「行業報告」人工智能行業研究報告

投資價值及機會:

當前語義識別領域,大的科技巨頭樂衷於收購,小而美的企業更偏好細分場景。

「行業報告」人工智能行業研究報告

關於語義識別領域的創業公司,國內代表企業有出門智能360、出門問問、三角獸、驀然認知等。

大公司更側向於做平臺方面的通用技術,基於平臺,如果有好的項目出現,直接收購。做小而美的公司,在特定場景下的語義分析,難度要比通用行業的語義分析難度低,準確率甚至可以達到85%以上,原因是基於特定場景下的語料分析,由於語料相對特定,可以在一定程度上提高準確率。

智能客服:智齒科技 小I

法律諮詢:無訟、法律谷等

(3)計算機視覺

技術原理:

計算機視覺在技術流程上,首先要得到實時數據, 此步驟可通過一系列傳感器獲取,少部分數據可直接在具備MEMS功能的傳感器端完成處理,大部分數據會繼續傳輸至大腦平臺,大腦由運算單元和算法構成,在此處進行運算並給出決策支持。

「行業報告」人工智能行業研究報告

應用場景:

計算機視覺應用場景可分為兩大類:圖像識別和人臉識別,每類又可繼續劃分為動、靜共四個類別, 基本覆蓋了目前計算機視覺的各項應用場景。其中動態人臉識別技術是目前創業熱度最高的細分領域,尤其是金融和安防場景,是其重點佈局場景。

「行業報告」人工智能行業研究報告

投資價值及機會:

對於計算機視覺而言,其主要瓶頸在於受圖片質量、光照環境的影響,現有圖像識別技術較難解決圖像殘缺、光線過爆、過暗的圖像。此外,受制於被標記數據的體量和數量,若無大量、優質的細分應用場景數據,該特定應用場景的算法迭代很難實現突破。當前,計算機視覺市場技術較為成熟,第一梯隊格局已經形成,留給創業公司的機會已經不大。

「行業報告」人工智能行業研究報告

五、總結

1)目前AI的發展仍處於早期,感知技術取得一定成就,認知技術發展仍待突破;

2)芯片的未來,AI定製芯片必為趨勢,創業公司在垂直領域AI芯片的研發領域仍有機會;

3)算法是競爭的一個障礙,但AI如何結合生活和業務場景,進行落地,才是真正的難點;

4)語義識別發展瓶頸仍然較大,小而美的企業具備收購價值;

5)有一手數據源、能夠與實際業務相結合的公司有望建立起自身的競爭壁壘,數據將成為制約AI公司在行業領域發展速度以及競爭門檻的重要要素。


分享到:


相關文章: