隨著自動駕駛、4K/8K視頻、AR/VR、物聯網等應用興起,社會的生產力、生產資料和生產工具正發生變革。在華為Cloud&AI產品與服務總裁侯金龍看來,算力已成為新生產力,數字、數據成為新生產資料,而5G+雲+AI則成為了新生產工具。
根據華為GIV2025全球產業洞察預測,到2025年數據總量180ZB,是2018年數據量的5.5倍。但在當前,僅有不到2%的企業數據被保存,而其中只有不到10%的數據得到分析和利用,數據的價值遠沒有得到充分挖掘。
為了更好地讓算力匹配日益增加的數據分析處理需求,近兩年來AI正在和雲與網絡深度融合,全球巨頭企業也紛紛構建自己的AI超級計算平臺。放眼全球,谷歌、英特爾、英偉達都在著力打造AI導向的大型數據中心;而在國內,過去兩年間,由BAT、華為等企業瞄準不同行業或技術門類的15家國家新一代人工智能開放創新平臺已分批確立。
鵬城雲腦機房 圖片來源:每經記者 王晶 攝
11月29日,鵬城實驗室與華為在深圳共同發佈鵬城雲腦Ⅱ基本型,它採用搭載華為鯤鵬、昇騰處理器的Atlas 900集群提供的算力,由鵬城實驗室研究雲腦平臺關鍵技術,支撐AI領域諸如計算機視覺、自然語言、自動駕駛、智慧交通、智慧醫療等各類基礎性研究與探索。
明年算力規模將邁入1000P FLOPS
據悉,Atlas 900由數千顆昇騰910 AI處理器組成,是全球最快的AI訓練集群。在衡量AI計算能力的標準ResNet-50圖片分類模型下,Atlas 900只用59.8秒就完成了訓練,在同等精度下比原世界紀錄快10秒。Atlas 900可廣泛應用於科學研究與技術創新,比如天文探索、氣象預測、自動駕駛、石油勘探等領域。
鵬城實驗室主任、中國工程院院士高文對包括《每日經濟新聞》記者在內的媒體透露:“鵬城雲腦Ⅱ原型系統現已實現100P FLOPS(每秒百億億次計算)的算力。明年,鵬城雲腦Ⅱ將達到1000P FLOPS,成為領先的AI研究平臺。”而當今世界上最強的超級計算機算力約為235P,1000P算力則相當於50萬臺電腦的算力之和。
“Atlas 900是一個集群系統,它不是算力的簡單疊加。1000P建起來後可以想像,AI訓練速度會更快,會極大推進AI的研究進程。原來做一件事情,(耗時)是分鐘甚至小時的級別,有了1000P的系統,只需要秒級別就可以了。AI集群不僅僅是算力的堆砌,更重要的是把龐大的算力高速、無阻塞的連接起來,並用分佈式集群軟件協同起來。”華為雲副總裁朱照生說道。
據記者現場瞭解,目前雙方正在聯合攻堅AI集群的規模進化以及AI功能的進化,解決散熱、組網等影響AI集群擴展的關鍵問題,為實現1000P級AI算力掃清障礙。
生態建設是發展難題
不過,隨著AI算法和需求的不斷髮展,算力不足、訓練時間長一直是困擾人工智能領域的主要矛盾,而造成這一問題的主要原因在於,算力的供應被少數廠商壟斷。目前,英特爾以X86架構佔據了服務器芯片九成以上的市場份額。
事實上,想要挑戰英特爾的壟斷地位,僅靠技術還不夠,生態系統的建立才是難點。此前,Gartner半導體和電子研究副總裁盛陵海曾對記者分析稱,在目前英特爾X86所統治的服務器市場,ARM陣營最大的問題在於生態,這是很難突破的壁壘。
對此,華為的解決方案是硬件開放、軟件開源,使能合作伙伴,同時發展生態。侯金龍表示:“未來三年,我們會投資15億美元發展整個生態合作伙伴。開發者是產業的靈魂,計算產業沒有開發者是沒有用的。我們現在和各個高校一起,把基於鯤鵬和昇騰的計算架構體系與各個高校聯合起來開發教材,讓學生至少可以學習我們這個體系,以後不僅僅懂X86也可以懂鯤鵬,會在這個平臺上進行開發。”
侯金龍強調稱,數字世界如果只是建立在一個沒有選擇的基礎上,將是非常危險的。在服務器方面,現在這個世界只有一種選擇就是X86,希望未來會出現第二種選擇。
每日經濟新聞
閱讀更多 每日經濟新聞 的文章