中美人工智能報告(二)

中美人工智能報告(二)

本篇列舉中美頭部AI廠商,從技術儲備、技術佈局的對比,更直觀的分析當前動態。

◆ 谷歌在全球AI廠商中整體實力領先,百度在中國AI廠商中綜合實力領先◆ 美國AI廠商中,谷歌是領導者,微軟、亞馬遜緊隨其後,而臉書與IBM分別由於生態與技術深度的欠缺稍顯落後◆ 中國AI廠商中,百度領銜,阿里、騰訊、華為等積極跟進

中美人工智能廠商實力對比

中美人工智能報告(二)

技術儲備

谷歌

擁有深度學習領軍級別科學家,在基礎科學研究領先全球

AI專利9536件

AI專家 深度學習教父: Geoffrey Hinton

AlphaGo之父: Demis Hassabis

世界著名未來學家: Ray Kurzwei

研發投入: 162億美元,佔營收比:14.6%(2018)

數據中心: 全球15個(2018)

微軟

專利儲備全球第一,也促使其在技術佈局的廣度與深度均有領先

AI專利18365件

AI專家 深度學習領域“三駕馬車”之一: Yoshua Bengio

計算機視覺專家: Harry Shum

微軟亞洲研究院:沈向洋、 印奇等

研發投入: 123億美元, 佔營收比: 13.7%(2018)

數據中心: 全球42個(2018)

亞馬遜

研發投入居全球首位,為技術儲備的豐富度提供支撐

AI專利未排入IPlytics2019全球前十

AI專家 MXNet 框架作者: 李沐

CHINASYS研究社區創始人: 張崢教授

人類語言科技組首席科學家: Hassan Sawaf

研發投入: 226億美元,佔營收比: 12.7%(2018)

數據中心:全球116個(2018)

IBM

得益於自身軟件積累和基礎科學研究,技術儲備較為完備,並圍繞Watson全面佈局AI技術;專利方面優勢明顯,並已轉型為認知解決方案和雲平臺公司

AI專利15046件

AI專家 Watson/M首席科學家: Grady Booch

IBM 研究院類腦計算首席科學家: Dharmendra Modha

研發投入: 每年在Watson投入研發為30+億美元

數據中心: 全球60個(2018)

臉書

技術儲備相比其他廠商較少,但由於圖片與文本數據積累較大,在計算機視覺與自然語言處理等技術優勢明顯

AI專利未排入IPlytics 2019年全球前十

AI專家 深度學習領域“三駕馬車”之一:Yann LeCun

資深機器學習專家: Joaquin Quiñonero Candela

研發投入: 78億美元,佔營收比: 19.1%(2018)

數據中心: 全球12個(2018)

擁有較高專利申請量與實力雄厚的AI技術團隊, 為其持續進行產品創新研發奠定基礎

AI專利5712件

AI專家首席技術官: 王海峰

計算機視覺領域頂級科學家:David Forsyth

計算語言學專家:Mark Liberman

研發投入: 20億美元,佔營收比: 15.2%(2018)

數據中心: 中國10+個(2019)

阿里

在研發人員佔比、 研發投入等方面實力雄厚, 加之產業生態豐富,擁有海量業務數據,支撐其技術儲備

AI專利3079件

AI專家 Caffe框架作者:賈揚清

前360人工智能研究院副院長:譚平

研發投入: 36億美元。佔營收比: 14.4%(2018)

數據中心: 中國8個(2019)

華為

注重研發投入,在ICT領域的技術研發頗具實力

AI專利3656件

AI專家 計算廣告學和智能推薦系統專家:汪軍

自然語言處理專家:劉群

計算機視覺專家:田奇

研發投入: 147.4億美元。佔營收比: 14.1%(2018)

數據中心: 中國5個(2019)

騰訊

專利數量豐富

AI專利14115件

AI專家 醫療AI科學家:鄭冶楓

量子計算科學家:張勝譽

計算機視覺領域著名專家: 賈佳亞

研發投入: 27億美元。佔營收比: 7.3%(2018)

數據中心: 中國14個(2019)


技術佈局

谷歌

擁有世界頂尖科學家團隊,重視基礎科學研究,同時創新能力出眾,使其在技術佈局上全球領先

語音識別:SwitchBoard:端到端系統的錯詞率降至5.6%(2017)

計算機視覺:ImageNet賽事:分類數據集錯誤率為6.66%(2014)

其他:新算法Noisy Student(EfficientNet)在SOTA

ImageNet上再次刷新世界紀錄(2019)

自然語言處理

• SQuAD1.1最佳成績:第1名,EM值89.898,F1值95.080

• SQuAD2.0最佳成績: 第2名, EM值89.731,F1值92.215

• 語言翻譯表現: 105種語言文本翻譯

• BERT模型突破了傳統RNN模型的限制,實現結合上下文理解整體語境(2019)

機器學習:創新研究:自動機器學習模型AutoML;深度學習框架排名:TensorFlow排名第一(Power Score,2018)

自研芯片:訓練+推理芯片: TPU 3.0算力90Tops,製程12/14nm

技術亮點:量子霸權: 計算支持方面領先全球


微軟

不同方向均有領先,在語音識別與計算機視覺等方向都率先達到類人水平

語音識別:SwitchBoard: 5.1%的語音識別錯誤率(2017)

計算機視覺:mageNet賽事大滿貫: ImageNet圖像分類、定位、檢測三項賽事第一(2015);

利用超過152層的神經網絡,將錯誤率降低至3.5%,此前人眼最低為5.1%(2015)

自然語言處理

• SQuAD1.1最佳成績: 第9名, EM值85.954,F1值91.677

• SQuAD2.0最佳成績:第15名, EM值85.082,F1值87.615

• 語言翻譯表現: 60+種語言文本翻譯(2019)

機器學習:雲上機器學習: Azure AI提供包括ML Net與CognitiveService等多種平臺型機器學習服務

深度學習開源框架:CNTK訓練速度較快,但已不再更新

技術亮點:Azure Quantum: 微軟發佈全棧式開源量子云生態系統


亞馬遜

AI芯片技術實力突出,具有較強的競爭優勢;相較x86同類芯片,Graviton2計算量提升4倍,單核性能強於英特爾至強鉑金

語音識別:Interspeech:《ASR的可伸縮多語料庫神經語言模型》 論文中的模型的單詞識別錯誤率比基線降低6.2%;其他:相比7-mic系統,2-mic語音識別系統語音識別準確率提高了9.5%(2019)

計算機視覺:人臉識別產品Rekognition增加自定義標籤功能,可使用少量標籤圖形訓練高質量的定製視覺模型

自然語言處理

• 語言翻譯表現: 20+種語言文本翻譯

• 語料庫: 累計410萬字和21萬條話語的聊天語料庫(2019)

• SQuAD暫無公開成績

機器學習:深度學習框架排名: MXNet排名第六(Power Score,2018)

訓練芯片:Inferentia,算力128Tops;Graviton,製程16nm;Graviton2,製程7nm

技術亮點:雲中深度學習: 89%的深度學習項目在AWS上運行


IBM

以Watson平臺佈局AI技術,不斷深化Watson人工智能認知計算的能力, 使其自然語言處理、芯片方面均有所優勢

語音識別:SwitchBoard:語音識別中的單詞錯誤率降低至5.5%(2017)

計算機視覺:CVPR會議: BlockDrop將圖像分類的平均速度提高了20%,準確性保持76.4%(2018)

自然語言處理

• SQuAD1.1最佳成績:第44名, EM值73.765,F1值81.257

• SQuAD2.0最佳成績:第47名, EM值72.670,F1值75.507(2018)

•語言翻譯表現:Watson Language Translator識別語言62種

機器學習:Watson Studio:支持使用頂級開放源代碼工具來模擬和部署數據解決方案;首個用機器學習開發阿爾茨海默症關鍵生物標記物的血液監測方法,準確率77%

自研芯片:類腦芯片:TrueNorth,內置100萬個模擬神經元和2.56億個模擬神經突觸

技術亮點:量子計算系統: IBM Q System One是全球首個商用集成量子計算系統


臉書

臉書技術開源程度高,計算機視覺技術領先,擁有440萬張標籤化的人臉池

語音識別:自監督語音識別算法:基於wav2vec的模型實現2.43%的單詞錯誤率(2019)

計算機視覺:開源技術Deepface:人臉識別準確率97.25%(2014)

在SOTA上state-of-art on ImageNet第二(2019)

自然語言處理

• SQuAD1.1最佳成績:第31名, EM值77.237,F1值84.466(2017)

• SQuAD2.0最佳成績: 第8名, EM值86.820, F1值89.795(2019)

• 語言翻譯表現: 20+種語言文本翻譯

• 提出預訓練模型BART,刷新SOTA多項任務

機器學習:深度學習框架排名: Pytorch排名第三(Power Score, 2018)

自研芯片:暫未推出自研AI芯片;訓練:Zion硬件平臺,用於模型培訓;推理: Kings Canyon平臺,針對AI推理優化

技術亮點:人工智能+區塊鏈應用:為人工智能所需數據實現去中心化


在機器學習平臺、計算機視覺、自然語言處理、語音識別等AI核心技術方面是中國AI行業的領導者

語音識別:詞錯率:遠場語音識別降低錯誤率30%(2019)

SMLTA模型創新全球第一,語音識別準確率97%(2016)

計算機視覺:ICCV VOT: 單目標短時跟蹤冠軍(2019);

ICME:人臉106關鍵點檢測比賽冠軍(2019)

LFW:人臉識別準確率99.77%(2018)

自然語言處理

• SQuAD1.1最佳成績: 第9名, EM值85.944,F1值92.425(2019)

• SQuAD2.0暫無公開成績

• 語言翻譯表現:28個語種(2019)

• ERNIE2.0框架在多種NLP任務上,效果超越BERT和XLNET; 2019年GLUE榜單突破90大關,打破世界紀錄

機器學習平臺排名:在中國市場位居第一(IDC,2019)

自研芯片:訓練+推理: “百度崑崙”,260Tops,製程14nm;遠場語音交互:“百度鴻鵠”,平均功耗僅100mW

技術亮點:全棧:“百度崑崙”與飛槳深度結合,打造全棧國產技術生態

量子計算:通過“量子分治”策略加速機器學習的路徑


阿里

在機器學習框架、自研芯片等方面居於領先地位

語音識別:LibriSpeech:DFSMN模型準確率96.04%(2018)

計算機視覺:LPIRC:在線圖像分類任務排名第一,實現23ms的單張圖片分類速度(2019)

WebVision:82.54%準確率(2019)

PascalVOC comp4榜單:92.9綜合得分,位居第一(2019)

自然語言處理

• SQuAD1.1最佳成績:第16名, EM值82.440,F1值88.607(2018)

• SQuAD2.0最佳成績:第40名, EM值77.003, F1值80.209(2018)

• 語言翻譯表現:阿里翻譯支持19個語種實時翻譯(2019)

EMNLP BB Task第一(2019)

機器學習平臺排名:在中國市場位居第二(IDC,2019);PAI 3.0:10+種場景的算法模型;提供100+種算法組件

自研芯片:推理: Ali-NPU; 含光800,性能78563 IPS,製程7nm,能效比500 IPS/W

技術亮點:量子電路模擬器“太章”


華為

以芯片為核心,昇騰910算力目前業界最強,芯片實力是華為在AI領域的核心競爭力之一

語音識別:準確率:將語音文件、實時語音數據流轉換為漢字序列,準確率90%以上(2019)

計算機視覺:ImageNet:ResNet-50在ImageNet數據集以10分28秒奪冠(2018)

ICDAR:與華中大在發票文本的端到端識別任務中以96.43%的精度奪冠(2019)

MegaFace: 收購的Vocord公司的曾在2016-2017年度奪冠

• DigSci科學數據挖掘大賽:語音語義Lab奪冠(2019)

自然語言處理

• SQuAD暫無公開成績

機器學習平臺排名:在中國市場位居第四(IDC,2019)

自研芯片:訓練: 鯤鵬系列; 推理: 麒麟系列,鴻鵠系列,其中昇騰910,FP16算力256Tops, INT8算力512Tops,製程7nm

技術亮點:量子計算模擬器與編程框架HiQ雲服務平臺;5G技術


騰訊

重視語音識別與合成、聲紋識別、圖像識別等方向的研究,語料庫龐大,在語音、視覺等領域技術擁有一定實力

語音識別:識別率:通用領域的語音識別率最高可達到95%,實時率為0.27%;語音合成MOS值為4.4,聲紋識別準確率為99%(2019)

計算機視覺:PascalVOC comp4榜單:91.2綜合得分(2019)

MegaFace:83.290%的準確率100萬級別人臉識別測試(2017)

LFW:刷新世界紀錄,99.8%(2017)

自然語言處理

• SQuAD1.1最佳成績:第16名, EM值81.790, F1值88.163(2017);

• SQuAD2.0暫無公開成績

• 語料庫: 包含800+萬個漢語詞彙(2018)

• 語言翻譯表現: 騰訊翻譯君支持17個語種實時翻譯(2019)

機器學習平臺排名:在中國市場位居第三(IDC,2019);Angel 3.0:100+多家公司和機構使用Angel3.0(2019);TI-ML: 一站式機器學習生態服務平臺

自研芯片:暫未推出自研AI芯片

芯片公司投資:燧原科技2019年12月發佈雲端AI訓練芯片邃思DTU,聲稱單卡單精度算力20Tops,混合精度算力80Tops,12nm工藝,141億個晶體管,預計2020上市

技術亮點:量子計算實驗室;Robotics X 機器人實驗室


分享到:


相關文章: