雲計算化和AI化是IT架構變化的兩大驅動力。
雲計算化:數據中心架構經歷多次變革,從最初的大型機系統逐步演變為獨立的服務器系統,隨著軟件技術的發展,又開始走向分佈式的雲架構。
AI化:算力需求提升將增加對算力基礎設施的投入。目前大多數神經網絡計算仍然用於推理(部署)而不是訓練,意味著公司需要重新調整用途或購買更多的芯片進行訓練。傳統CPU服務器不能滿足大量並行算法的需求。隨著GPU 進入7nm時代,AI GPU服務器的需求也將繼續年化100%以上的增長。報價5000元,1498052617
谷歌發佈全球首個產品級移動端分佈式機器學習系統 ,移動端算力被充分調動。2019年 2月谷歌宣佈實現了全球首個產品級的超大規模移動端分佈式機器學習系統,目前已經能夠在數千萬部手機上運行。谷歌基於 TensorFlow 構建了全球首個產品級可擴展的大規模移動端聯合學習系統,目前已在數千萬臺手機上運行。這些手機能協同學習一個共享模型,所有的訓練數據都留在設備端,確保了個人數據安全,手機端智能應用也能更快更低能耗更新。研究人員表示,該系統有望在幾十億部手機上運行。聯合學習能產生更智能的模型,更低的延時和更少的功耗,同時確保用戶的隱私。
Google 開放的聯合學習算法,使得移動端分佈式機器學習成為現實;AI規模的移動端,協同輸出一個學習模型,而不必上次用戶本地數據。Google 的研究團隊克服許多算法和研究挑戰,使聯邦學習成為可能。諸如隨機梯度下降(SGD)之類的優化算法(通常在許多機器學習系統中使用)在大型數據集上運行。在移動端特定環境中,數據以高度異構的方式分佈在數百萬個移動和蜂窩設備上,這些設備具有明顯更高延遲,更低吞吐量的連接,並且只能間歇性地用於訓練。這一切都依賴於聯合學習(FL)方法,聯合學習是一種分佈式機器學習方法,可以對保存在移動電話等設備上的大量分散數據進行訓練,是“將代碼引入數據,而不是將數據引入代碼”的更加通用化的一個實現,並解決了關於隱私、所有權和數據位置等基本問題。
根據谷歌官博介紹,用戶的設備會下載一個當前模型,這個模型會從手機數據中學習不斷得到改善,然後將變化總結為一個小的關鍵更新。只有這個關鍵更新會以加密的方式被傳到雲端,之後這一更新會在雲端迅速被其他用戶對共享模型提交的更新平均化(averaged)。簡單說,所有的訓練數據都留在用戶的設備上,而且上傳到雲端的個別更新也不會存儲到雲端。谷歌研究人員表示,新方法將機器學習與雲端存儲數據的需求脫鉤,讓模型更聰明、延遲更低、更節能,而且保護用戶隱私不受威脅。這一方法還有一個間接好處:除了實現共享模型的更新,用戶還能立刻使用改善後的模型,根據個人使用手機方式的不同,得到的體驗也會不同。
圖表 79:谷歌移動端分佈式聯合機器學習工作流程
![產業深度:2020年雲算力產業趨勢展望報告](http://p2.ttnews.xyz/loading.gif)
聯合學習(FL,Federated Learning)系統已經在非常流行的谷歌鍵盤Android上的Gboard中進行測試。每當 Gboard 顯示建議的查詢時,移動設備本地存儲有關當前上下文的信息以及您是否使用了該建議。聯合學習處理設備上的歷史記錄,以建議改進 Gboard 的查詢建議模型的下一次迭代。諸多移動設備的學習模型將通過一種聯合學習算法聚合成為一個更簡潔的模型,最後只需要將這個模型上傳至雲端即可。
圖表 80:谷歌Android 設備鍵盤 Gboard 會根據聯合學習算法不斷更新用戶的查詢建議模型
![產業深度:2020年雲算力產業趨勢展望報告](http://p2.ttnews.xyz/loading.gif)
要將這樣的系統部署到數百萬運行 Gboard 的異構電話,需要相當先進的技術堆棧。設備上培訓使用 TensorFlow 的最小化版本。上傳速度通常比下載速度慢得多,研究人員還開發了一種新方法,通過使用隨機旋轉和量化壓縮更新,將上傳通信成本降低到 100 倍。複雜的人工智能算法訓練與計算經常涉及上億的參數,這些參數的計算需要大量的計算能力,目前在深度學習領域,GPU 計算已經成為主流 。使用 GPU 運算的優勢如下:目前,主流的 GPU 具有強大的計算能力和內存帶寬,同時 GPU 的 thousands of cores的並行計算能力也是一大優勢。只要數據足夠小,就適合在一臺 GPU 性能優於其它架構的機器上運行,因為它不具備處理網絡開銷問題的功能,可以充分利用GPU 的優勢為數學運算。由於所有的數據集足夠小,可以適應內存,網絡成為了分佈式實現的瓶頸,而移動端本地 GPU 沒有這樣的瓶頸,得到了兩全其美。可以預期的未來的 IT 基礎設施將向“兩端走”,一方面是超大規模IDC,用作集中式數據處理、搜索和機器學習,而賴移動設備和物聯網智能設備未來將越來越依賴 GPU 的運的算能力,硬件中的 GPU 算力將會得到進一步提升。
正文目錄
1、雲計算進入算力時代... 7
1.1、數據是 AI 學習的基礎,算力是必備條件... 7
1.1.1、成本下降推動算力需求增長... 7
1.1.2、需求端:業務發展大大提升算力需求... 10
1.1.3、算力的安迪-比爾定律... 13
1.2、算力投資將成為雲中心資本開支重點... 16
1.2.1、雲巨頭先後佈局超算雲,搶佔新市場... 20
1.2.2、GPU:應用場景廣泛,具有較完整的技術生態... 24
1.2.3、FPGA術密集型行業,美國壟斷全球市場... 32
1.2.4、ASIC:開發週期長,量產成本低... 35
1.2.5、人工隨機相變神經元是人工智能芯片質的飛躍... 38
1.3、我國算力核心基礎相對薄弱... 44
1.4、5G、AI 和區塊鏈融合趨勢... 45
1.5、互聯網巨頭開始爭奪下一代通用平臺... 47
2、算力、算法和數據發展... 48
2.1、算法:由中心封閉到開源化、模塊化... 50
2.2、算力:從集中雲算力走向終端分佈式算力... 51
2.3、數據:由“無主”的壟斷走向確權治理... 54
2.4、市場激勵:經濟利益向用戶傾斜... 59
3、分佈式 AT、雲算力、區塊鏈... 61
3.1、雲算力崛起為新一代互聯網基礎設施... 61
3.2、分佈式 AI崛起:移動端硬向件構架向 GPU 傾斜... 68
3.3、雲算力時代共識機制有待重新審視... 72
4、區塊鏈:給大數據賦予經濟動能... 73
4.1、區塊鏈:下一代智能互聯網的基石... 73
4.2、區塊鏈將建立一個規範健康的數據市場... 80
4.3、區塊鏈推動算力和算法、數據市場分離,催生全新商業場景模式... 81
4.4、區塊鏈為雲算力市場提供經濟動能和市場激勵... 83
4.5、區塊鏈算力產業鏈... 85
4.5.1、礦機生產商... 87
4.5.2、礦場... 88
4.5.3、礦池... 89
4.5.4、雲挖礦... 90
5、5G 邊緣計算:“硬核”算力之基... 91
5.1、分佈式系統的崛起催生邊緣計算平臺和新的網絡構架... 91
5.2、雲算力視角下邊緣 IDC價值的再認識... 93
5.3、數據中心的未來方向:超大型和邊緣機房... 94
6、主要公司產品... 98
6.1、阿里含光 800AI 推理芯片... 98
6.2、華為AI 訓練芯片昇騰 910. 100
6.3、百度AI 加速芯片-KUNLUN1. 106
7、發展風險... 108
圖表目錄
圖表 1:2016-2025年全球人工智能市場規模 (單位:百萬美元)... 8
圖表 2:不斷下降的計算成本... 8
圖表 3:ICT行業發展路徑... 11
圖表 4:各業務計算能力與帶寬要求... 11
圖表 5:各業務計算能力與存儲要求... 12
圖表 6:算力的安迪-比爾定律... 13
圖表 7:過去 120 年計算能力(單位:秒 / 美元 / 算力)... 13
圖表 8:歷年全球超級計算機 TOP1FLOPS. 14
圖表 9:世界最大 GPU—NVIDIADGX-2. 15
圖表 10:NVIDIADGX-2 參數... 15
圖表 11:雲算力需求的分類... 16
圖表 12:2018-2019年全球主要雲計算廠商合計單季度收入(億美元)... 17
圖表 13:2018-2019年國外雲計算廠商單季度 CAPEX(億美元)... 18
圖表 14:2018-2019年國內主要雲計算廠商合計單季度 CAPEX(億美元)... 18
圖表 15:2017-2019年Q3英特爾雲數據中心收入與全球服務器出貨量增速... 19
圖表 16:雲廠商超算雲服務業務佈局... 20
圖表 17:2014-2020年全球雲算力投資總規模... 21
圖表 18:2014-2020年雲算力投資比例及結構... 21
圖表 19:2014-2020年全球雲算力投資總規模 (億美元)與雲算力投資比例... 22
圖表 20:雲計算產業鏈... 23
圖表 21:全球CPU性能增長遇到瓶頸(per socket,%)... 24
圖表 22:GPU 市場格局... 25
圖表 23:GPU 生產廠商概況... 25
圖表 24:傳統服務器無法滿足日益增長的AI算力需要... 26
圖表 25:1.25倍性能提升的同時降低50%功耗... 27
圖表 26:相比於10nm GPU 優勢明顯... 27
圖表 27:以英偉達為主導的AI服務器產業鏈情況... 28
圖表 28:服務器成為未來GPU的主要出貨選擇... 28
圖表 29:GPU 40年間的趨勢數據... 29
圖表 30:GPU的應用領域... 30
圖表 31:FPGA 的優點與限制因素... 32
圖表 32:FPGA 四大巨頭概況... 33
圖表 33:FPGA 的應用領域... 33
圖表 34:阿里雲異構計算產品體系圖示... 34
圖表 35:微軟Project Brainwave的硬件示例... 34
圖表 36:ASIC的性能特點... 35
圖表 37:ASIC 市場格局... 36
圖表 38:國內外主要的激光雷達企業概況... 37
圖表 39:神經元構造... 38
圖表 40:清華大學研發的人工神經突觸... 39
圖表 41:單個人造神經元的構造... 40
圖表 42:相變存儲的的工作原理... 41
圖表 43:單個人工神經元工作原理... 42
圖表 44:2019年我國算力核心基礎相對薄弱... 44
圖表 45:當前的互聯網模式下巨頭事實上壟斷了數據、價值和網絡效應,處於產業鏈核心 46
圖表 46:區塊鏈、AI 和 5G 的融合下,未來互聯網商業模式將被顛覆... 47
圖表 47:下一代通用平臺... 47
圖表 48:區塊鏈帶來數據市場治理、加速打破互聯網價值壟斷... 48
圖表 49:區塊鏈、AI 和 5G 融合,催生互聯網商業新模式... 49
圖表 50:算力、算法、場景是AI鐵三角... 50
圖表 51:AI 算力發展歷程... 51
圖表 52:AI 算力發展情況... 51
圖表 53:與深度學習結合的NLP與傳統方法對比... 52
圖表 54:Google與微軟完成NLP突破... 52
圖表 55:BERT 理解上下文架構示意圖... 53
圖表 56:2012年以來AI算力需求增長30萬倍... 53
圖表 57:2018 年國內互聯網公司重要數據洩露事件... 55
圖表 58:2018 年國外互聯網公司重要數據洩露事件... 55
圖表 59:移動端分佈式學習並不需要上傳本地隱私數據,將成為打破數據壟斷的關鍵一環 58
圖表 60:未來時代,數據價值向用戶傾斜... 59
圖表 61:全球連接數 10年增長 10倍... 61
圖表 62:2018-2025年全球存儲量快速增長(單位:ZB)... 62
圖表 63:谷歌移動端分佈式聯合機器學習工作流程... 63
圖表 64:全球雲計算市場被主要幾家巨頭壟斷... 64
圖表 65:對時延不敏感的大規模數據計算業務是雲算力最理想的市場... 65
圖表 66:過去 2 年多數字貨幣市場處於熊市階段... 66
圖表 67:比特幣全網算力接近歷史新高... 67
圖表 68:容器架構與虛擬化架構對比... 67
圖表 69:谷歌移動端分佈式聯合機器學習工作流程... 69
圖表 70:谷歌 Android 設備鍵盤 Gboard 會根據聯合學習算法不斷更新用戶的查詢建議模型 70
圖表 71:PoW 機制是天然的價格機制,為市場提供激勵與約束... 72
圖表 72:區塊鏈賬本運行原理... 75
圖表 73:區塊鏈的分佈式系統達成共識的過程... 75
圖表 74:傳統財富是以中心化機構為核心進行流轉... 76
圖表 75:區塊鏈賬本登記的財富流轉於去中心化網絡... 77
圖表 76:隨著數字貨幣的發展,區塊鏈成為新一代互聯網基礎協議... 78
圖表 77:區塊鏈的應用場景... 78
圖表 78:區塊鏈行業應用場景面臨的挑戰... 79
圖表 79:CPU、 GPU、 ASIC挖礦性能對比... 80
圖表 80:比特幣礦機生產廠商概況... 80
圖表 81:區塊鏈、AI 和 5G 融合,催生互聯網商業新模式... 81
圖表 82:區塊鏈為雲算力和算法、數據市場實現分離提供經濟動能和數據隱私保護... 82
圖表 83:基於 Golem 區塊鏈網絡將閒置的個人計算資源打造成雲算力平臺... 84
圖表 84:BTC 的不同類型礦機對比... 85
圖表 85:2010-2019年BTC全網算力變化圖... 86
圖表 86:BTC 挖礦產業鏈... 86
圖表 87:BTC 的主要礦機生產商... 87
圖表 88:比特大陸官網發佈螞蟻礦機 S17+. 87
圖表 89:2015-2017 三大礦機生產商利潤(單位:億元)... 88
圖表 90:ASIC 礦機組成的 BTC 挖礦礦場... 88
圖表 91:2019 年 11 月 28 日 BTC 哈希算力分佈... 90
圖表 92:雲挖礦流程示意圖... 90
圖表 93:5G 不同業務在不同點終結,邊緣計算平臺崛起... 91
圖表 94:數據中心呈現集約化、高密化、綠色化發展趨勢... 93
圖表 95:上海市工商業及其他用電的電價... 94
圖表 96:2009-2022 年中國 IDC 業務市場規模及預測... 94
圖表 97:IDC 超大型趨勢... 96
圖表 98:邊緣數據中心架構... 97
圖表 99:阿里含光 800 芯片... 98
圖表 100:阿里高性能數據庫一體機—POLARDB Box. 99
圖表 101:阿里第三代神龍架構... 99
圖表 102:鯤鵬主板全面開放... 100
圖表 103:華為基於昇騰 310 的產品和雲服務... 101
圖表 104:昇騰 910 的算力提升... 102
圖表 105:三種主流 AI 訓練芯片的參數比較... 102
圖表 106:華為昇騰產品發佈時間線... 103
圖表 107:華為 AI 產品解決方案... 105
圖表 108:華為 AI 產品發展解決的十大問題... 105
圖表 109:百度崑崙雲服務器... 107
閱讀更多 產業深度 的文章