許多網友想看英特爾獨立GPU,今天,它來了

“我擦,會場附近停車也太貴了一小時要13美元,我停一天才20”

“那咱們再轉一圈看看,找個路邊的咪表”

“算了吧,演講都已經開始了,就停會場樓下,貴就貴點吧。”

奧萊天是晴朗天,血拼購物好喜歡。可惜一聲電話響,馬不停蹄去會場。

許多網友想看英特爾獨立GPU,今天,它來了

丹佛岩石堡奧特萊斯

美國時間11月17日下午3點半,我驅車從奧萊一路狂飆80邁,趕回丹佛參加英特爾大會。雖然購物是我在美國的三大愛好之一,但為了大新聞我還是義無反顧的踏上了回程路。因為就在今天上午,我聽到了英特爾的一則重磅消息:英特爾高級副總裁、首席架構師以及架構、圖形與軟件部門總經理Raja Koduri將在下午的主會場演講上發佈期待已久的產品——Xe架構的GPU(俗稱顯卡)。

許多網友想看英特爾獨立GPU,今天,它來了

與購物相比,這樣重磅的猛料自然是不能錯過的。但是讓我沒想到的是,這次名為“英特爾高性能計算開發者大會”的內容如此豐富,雖然會期只有一天的時間,但是包括Raja Koduri在內的發言人分享了許多幹貨,讓我這個開發者的編外人員也都受益匪淺。

許多網友想看英特爾獨立GPU,今天,它來了

Raja Koduri登臺演講

丹佛時間下午4點整,Raja Koduri登臺開始介紹英特爾在GPU領域的突破(我納悶的是,為什麼英特爾把大佬的主題演講放在了下午的最後一個環節,真奇怪)。其實一直以來,在大家提到GPU的時候,都會想到NVIDIA和AMD兩家,但要是按照統計數據來說,英特爾才是顯卡出貨量的NO.1(是的,集成顯卡)。只是許多時候,大家對於集成顯卡並不感冒,或者大家認為只有獨立顯卡才能叫做“真正的顯卡”。

不過Raja Koduri並沒有單刀直入的介紹Xe架構的特性,相反他首先分析了行業的發展。“有人聽說過GPU嗎?”,這種美式幽默引起了臺下不少人的笑聲。其實對於這些開發者來說,他們無論對於x86還是GPGPU架構的開發環境都不會陌生,而英特爾如此佈局的目的,恰恰是進一步完善了產品線。

許多網友想看英特爾獨立GPU,今天,它來了

現場,Raja Koduri列舉了CPU、GPU、AI和FPGA等熱門芯片的例子,其實所有這些芯片英特爾都有所涉及,甚至還將許多功能整合在了一起(比如在CPU中植入AI推理功能)。換句話說,英特爾今天扮演的角色已不僅僅是一家CPU製造商,儘管許多人對它的定義依然如此。

許多網友想看英特爾獨立GPU,今天,它來了

雖然俗稱為顯卡,但是在數據中心特別是高性能計算的相關領域,GPU更大的作用在於科學計算而並非輸出絢麗的色彩。為此,英特爾對Xe架構的GPU也給出了集成+入門級的LP系列,數據中心/AI應用的HP系列和高性能擴展應用的HPC系列三大層級。

許多網友想看英特爾獨立GPU,今天,它來了

作為最高端產品,HPC級Xe的最大特性就是可以擴展到上千個執行單元(thousands)。這裡,每個執行單元都進行了升級,提供40倍的雙精度浮點計算能力。Xe HPC架構還將包括一個非常大的統一緩存,稱為Rambo緩存,它可以將多個GPU連接在一起。

許多網友想看英特爾獨立GPU,今天,它來了

另外值得一提的是,未來的Xe架構的GPU將採用7nm工藝製造,稱之為Ponte Vecchio。要說經過臺積電的先期科普,許多人都知道了7nm架構對於處理器的價值,包括英特爾的“老朋友”AMD也一直在強調目前基於架構工藝的領先性。這一次Xe架構採用了7nm,也說明英特爾對7nm的量產也有信心(雖然現在更“成熟”的10nm產品還依然很少)。另外相對於臺積電來說,大家對於英特爾的7nm也是充滿了期待。

許多網友想看英特爾獨立GPU,今天,它來了

還需要順便一句的就是英特爾在X架構內部採用的名為Xe-link的互連技術,當然目前這種技術基於CXL標準(即Compute Express Link) 。有了這些技術的加持,英特爾面向百億億次計算的信心就更足了,而在解決了傳統GPU應用的短板之後,英特爾似乎已經滿足了硬件層面HPC應用的所有要求,計算、加速、存儲、網絡應有盡有。

你愛一個女孩子十分卻能表達出一分,倒不如你愛她一分,卻能表達出十分——孟京輝《戀愛的犀牛》

不過在HPC領域,硬件性能固然重要,但是也並非起到決定性的作用,因為軟件和應用的優化才是重頭戲。俗話說“好馬配好鞍,好車配風帆”(風帆請把廣告費付一下),有了強大的硬件平臺之後,英特爾更希望實現上層軟件和應用的統一化,為此它特別推出了一款名為oneAPI的軟件計劃。在今天之前,我曾多次聽到過這一計劃,不過今天它終於正式發佈了。

從2000多年前秦始皇“書同文、車同軌”開始,“統一”的觀念就已經深入中國人的骨子裡,而在HPC應用的這一問題上,我們也同樣需要有統一的行業標準和平臺。“統一”的好處是不言而喻的,特別是對於開發者來說,大家採用同樣的接口標準或者編程平臺,那麼在後續的軟件優化與延續性方面來說都會事半功倍。

許多網友想看英特爾獨立GPU,今天,它來了

會上,Raja Koduri特別提到了oneAPI計劃的目標,就是開放、簡單擴展和無人掉隊。對於最後這點,Raja Koduri尤其強調了它的困難性(hardest),但是也正是這一點,才能夠使得所有的開發者站在同樣的起跑線上,也讓針對HPC應用的軟件和應用程序能夠有據可循。

許多網友想看英特爾獨立GPU,今天,它來了

按照構想,oneAPI是一個以開發者為中心的平臺,將為AI應用無處不在、多架構並存的世界重新定義一種新的編程方式。oneAPI提供一個通用、開放的編程體驗,讓開發者可以自由選擇架構,無需在性能上作出妥協,也大大降低了使用不同的代碼庫、編程語言、編程工具和工作流程所帶來的複雜性。oneAPI保留了現有軟件投資,包括支持現有語言,同時為開發人員創造更多豐富的應用程序提供了靈活性。說白了,就是不管你的底層硬件是什麼,通過oneAPI系統都可以針對硬件實現優化,智能的優化,針對不同的應用調用最好的資源,讓應用變得更好。

許多網友想看英特爾獨立GPU,今天,它來了

與此同時,Raja Koduri也宣佈了oneAPI測試版項目今天正式上線,有興趣的小夥伴可以去英特爾軟件官網看看(稍後可以註冊),這樣就可以在雲端實現開發環境的體驗了。不過針對這個測試版,我之前聽過有英特爾的朋友談到這個問題,畢竟oneAPI作為行業標準還在萌芽狀態,率先推出測試版的主要作用就是加強開發者之前的溝通與試錯。計劃在經過一年左右的磨合期之後,英特爾將會推出正式版。

許多網友想看英特爾獨立GPU,今天,它來了

講完了硬件,講完了軟件和應用平臺,就在大家以為演講即將結束的時候,Raja Koduri突然“放大招”,邀請了美國阿貢實驗室的專家Rick Stevens來分析美國第一臺E級超算平臺Aurora的相關細節。按公開資料,Aurora是美國能源部定製的一款百億億次超級計算機,也是第一臺採用英特爾架構的百億億次超級計算機,英特爾將所有未來的頂級技術都應用於該平臺。

許多網友想看英特爾獨立GPU,今天,它來了

按照計劃,Aurora的計算節點架構將由兩個10納米英特爾至強可擴展處理器(代號Sapphire Rapids的產品,不知道什麼時候上市)和六個Ponte Vecchio GPU(還是不知道什麼時候上市)共同組成。該系統同時還將支持超過10PB的內存和超過230PB的存儲容量,並能通過Cray Slingshot技術(更不知道什麼時候上市)連接超過200個機架的節點。三個“不知道”,為這套超級計算機增添了不少神秘色彩,也說明了英特爾包括美國的傾盡全力。

既然美國如此,中國是否也有類似的產品呢?答案是肯定的。其實早在多年前,中國就開始了百億億次E級超算原型機的研發,並且確定了三種技術路線。如今,三大路線的原型機都已經通過驗收,甚至許多設計理念已經付諸商用(我還參觀過其中一臺)。應該說,在百億億次的問題上,包括美國、中國、歐洲、日本等許多國家和地區都已經行動起來,而且所有人核心原則都是四個字“自主可控”。這也可以看出超級計算機在未來科技競爭中的龍頭地位,所謂“兵家必爭”。

話題扯得有些遠,讓我們迴歸到今天英特爾HPC開發者大會的主題上。僅僅在這次主題演講中,英特爾就透露了包括未來在GPU和軟件應用層的巨大動作,同時也滲透了包括處理器、網絡互連在內的許多技術信息。許多年來,英特爾一直都被網友戲稱為“擠牙膏”,但是在這次SC19大會上,我們看到英特爾真正拿出了許多商業化的技術,而且這些技術在每個垂直行業都堪稱領先。

許多網友想看英特爾獨立GPU,今天,它來了

英特爾稱這次大會為“One Intel Station”,翻譯過來就是“英特爾一站式購齊”。面向未來的HPC應用,英特爾已經準備好了多項頂尖的技術;但作為用戶的你,準備好錢了嗎?

我猜你會說這四個字——臥槽,無情!

許多網友想看英特爾獨立GPU,今天,它來了


分享到:


相關文章: