從底層到應用,百度大腦「幕後」架構探祕

2600年前,春秋時期,趙國。

晉國大夫趙朔被屠岸賈殺害,趙朔死前將遺腹孤兒託付給門客程嬰。程嬰捨去己子,攜趙朔的孤兒趙武潛入盂山藏匿15年之久,後人就把盂山改名為藏山。而藏山的所在地,就是如今的山西陽泉。

从底层到应用,百度大脑“幕后”架构探秘

說起陽泉這個地方,可謂是人傑地靈。幾千年前,這裡就是古仇猶國的所在地,而在近代歷史中,這裡更是“百團大戰”的主戰場。而陽泉這一次進入我們的視野,則是得益於一個熟悉的名字——百度。

在百度創始人李彥宏的家鄉陽泉,有一座佔地360畝的超大規模數據中心——百度雲計算(陽泉)中心。在這裡,百度部署了大量整機櫃服務器、HVDC(高壓直流)、OCU(置頂冷卻單元)等一系列業界領先的設備,也是目前百度全國幾十家數據中心裡規模最大的一家。

从底层到应用,百度大脑“幕后”架构探秘

“數據中心按照T3+標準設計建造,建築面積12萬平米,包括共4期8個模組,設計容納16萬臺服務器,擁有400+項專利技術。自2014年9月正式開始運行,到今天已經安全運行了1534天,”百度雲計算(陽泉)中心負責人,百度系統部高級經理顧鵬如是說。

从底层到应用,百度大脑“幕后”架构探秘

其實別看佔地面積這麼大,陽泉這座數據中心運營團隊只有幾十個人。“我們全部採用先進的自動化、智能化控制技術,需要巡視、維護、調控人員極少,每個班組2~3人就可以完成2個模組約3萬平米7×24小時運營”顧鵬介紹。

从底层到应用,百度大脑“幕后”架构探秘

作為超大規模的高端數據中心,這裡不僅僅在管理上實現了自動化,更重要的是在節能方面成效顯著。在數據中心模塊的樓頂,我們看到了大片的太陽能光伏板,這也是數據中心電力獲取的來源之一。“我們充分利用了模組樓頂的空餘地方,安裝了即發即用的清潔能源,陽泉數據中心是國內首個應用光伏發電的數據中心”。

其實除了太陽能發電的電力來源之外,風能電力也是陽泉數據中心的供電來源之一。據統計,2017年百度陽泉數據中心一共用了將近2600萬度風電,佔比整個用電量的16%。“2018年,我們基本上風電能達到5500萬度,清潔能源預計佔比可能達到23%以上。園區全部投產以後,數據中心年節約用電量預計達到2.5億度,可相當於13萬個家庭全年的用電量”

从底层到应用,百度大脑“幕后”架构探秘

除了電力供應之外,在數據中心普遍存在的發熱高、散熱難問題上,陽泉數據中心充分利用室外自然冷源,搭配多種空調末端技術,通過提高冷凍水供回水溫度、服務器進風溫度等措施,全年超過96%以上時間免費冷卻(Free Cooling),將單模組年均PUE(能源使用率)降低至1.10,這個數據在全球業界也處於領先範疇。

如今,陽泉數據中心已經承載了眾多百度的核心業務,大家熟知的“百度大腦”也部署其中。“數據中心為百度大數據業務、人工智能提供了強有力的支持,包括語音、圖像、搜索、無人車、加速計算等業務都是如此,成為百度大腦的動力引擎”。

說起百度大腦,其實就在不久前剛剛結束的上海“2018世界人工智能大會”上,搭載百度大腦110+先進AI能力的百度雲,還展示了包括在人工智能、大數據、雲計算在各個領域的落地。

从底层到应用,百度大脑“幕后”架构探秘

其實說起百度與英特爾的合作,已經有超過十年的歷史了。在此之前,雙方就已經在百度大腦、百度雲、DuerOS等方面進行了廣泛而深度的合作。

2018 ABCSUMMIT百度雲智峰會上,百度雲與英特爾再聯手,宣佈採用新一代對象存儲系統,首次推出Optane+QLC存儲設計方案,以及基於OpenVINO的視覺計算方案等等。

OpenVINO是用於增強視覺AI計算能力的軟件包,可以部署在數據中心到邊緣等多種硬件平臺上。曾經在百度雲智峰會上展示的蘇州環衛局實現渣土車實時監控的方案,就是百度雲視覺計算的典型應用業務。此前在與愛奇藝的合作中,百度雲基於英特爾至強6148處理器開展視頻黃暴內容識別業務,取得了相較之前平臺最高8.8倍的性能提升。

對於全面轉向AI的百度來說,AI的新型應用對存儲系統提出了新的挑戰,更智能的AI應用需要對大規模數據的高效處理,這也對於存儲的讀寫性能提出了新的挑戰。為此,百度雲基於英特爾最新的Optane和QLC SSD存儲介質打造了新一代對象存儲系統。該系統充分發揮了Optane介質的優勢,相比傳統基於HDD的對象存儲性能提升21倍,同時又挖掘了QLC介質高性價比的特點,使得最終系統的總體成本大大低於目前市面上的全閃存方案。

从底层到应用,百度大脑“幕后”架构探秘

此外,在無人駕駛領域中,英特爾也參與到百度自動駕駛L3和L4領域的解決方案研發中,包括傳感器融合,控制和規劃,以及Halo Creek和Car Branch的高清圖像集成。

9月25日,百度與Intel共同發起的“5G+AI邊緣計算聯合實驗室”正式揭牌成立,旨在加速國內邊緣計算(MEC)技術研發。雙方將充分發揮在技術和應用開發領域的優勢,共同對人工智能、車聯網、5G、邊緣計算、搜索、在線翻譯、VR/AR、物聯網等方面的技術、產品和商業模式進行探索。

可以說,在這個智能化、數據化的時代,我們需要類似百度大腦這種人工智能能力的集大成者,深度的理解真實世界,進而更好的支撐各種應用。但在這些酷炫的高科技背後,離不開強大的數據中心底層硬件支撐,特別是英特爾至強可擴展處理器、傲騰內存這樣更快速、更高效的平臺支持。

正如百度創始人李彥宏描述的那樣——讓機器去替代人的體力,我們在工業化時代已經解決了這個問題;如今,我們要解決的是,讓機器能夠像人一樣思考。


分享到:


相關文章: