有人說20年前的超級電腦,和現在的手機速度差不多,是真的嗎?

海藍天天


正好我在超級計算機上有大量的研究,說一下我的見解:20年前的超級計算機和現在的手機沒有太大可比性,就像在金庸武俠系列中我們很難比較掃地僧和張三丰誰更厲害一樣,我們也不能將歷史上不同時間節點上的兩個事物拿來比較,因為每個時間點上的事物都有其歷史意義。按計算任務來說,20年前的超算解決的問題更復雜,按技術成熟度來看,現在的手機芯片技術更成熟。

什麼是超級計算機

對於手機,我們已經非常瞭解,當前性能最強的手機有蘋果的iPhone X和華為的P30等。但是對於超級計算機,很多朋友並不瞭解。與普通的個人電腦和服務器相比,超級計算機(Supercomputer)是一種計算力極強的計算機,學術界通常稱這一領域為高性能計算(High-Performance Computing)。超級計算機主要為最頂尖的科學研究服務,包括核聚變、石油勘探、量子力學、氣候模擬、癌症研究、基因組學、分子動力學、飛機和航天器空氣動力學和當前火熱的各類民用人工智能。可見,超級計算機的服務對象是科學研究領域最前沿的方向,也是一個國家的技術命脈。

儘管超算的應用領域高大上,但其背後的計算機技術並沒有那麼神秘。與普通的計算機相比,超級計算機由超多個計算節點組成,其中節點指單臺計算機。每個節點配有CPU、GPU以及專用處理器,節點之間用高速網絡互聯。目前,所有TOP500的超級計算機均運行的是Linux操作系統。

看看曾奪得TOP500第一名的天河二號。天河二號擁有16000個計算機節點,每個節點配備2個Intel Ivy Bridge架構Xeon處理器和3個Xeon Phi協處理器,共計3,120,000個計算核心。天河2號上運行的是國防科技大學開發的麒麟(Kylin Linux)操作系統。Ivy Bridge其實離我們的生活並不遙遠,2012年以來個人電腦上的酷睿i3、i5和i7 CPU都是Ivy Bridge架構,只是天河2號上使用的這款CPU經常應用在服務器上,計算核心更多。

筆者在中山大學參觀天河二號實拍圖

可以說,超級計算機並不是一臺計算機,而是一批性能強勁的計算機組成的計算機集群。超算最核心的技術還是在於CPU等芯片,而世界上最優秀的芯片公司IBM、Intel、AMD、Nvidia都是美國公司。

超算的計算性能

超算解決的是科學研究問題,科學研究對計算的精度要求非常高,也就是小數點後要保留多少位的問題。試想,用超算模擬核武器反應,小數點稍微差一點點,真的是差之毫釐謬以千里。因此,很多超算任務要使用高精度的浮點數,衡量超算計算能力的時候,一般使用每秒能計算的浮點運算次數(Floating Point Operations Per Second,FLOPS或flop/s)。目前的頂級超算的這個指標都在P級,即10的15次方。中美等各大國都在摩拳擦掌積極籌備建設E級超算,也就是10的18次方。

超級計算機領域有個專門的榜單,名為TOP500,以FLOPS指標來對各個超算的性能做比較,並每半年給出一個排名,有點像世界大學排名。

曾經登頂TOP500榜首的超算計算機性能

20年前的超算 v.s. 現在的手機

20年前的超算世界第一是美國國家核安全局下屬Sandia國家實驗室的 ASCI Red 超級計算機,它於1997年投入使用,2006年完成歷史使命後退役。這正好也是一個劃時代的超級計算機,它首次在算力上突破T級別,即10的12次方,峰值算力為1.3T左右。而且,這也是第一臺採用大規模民用CPU芯片的超級計算機,使用的是Intel的奔騰系列CPU,每個奔騰CPU 200MHz,共計九千多個CPU。如果身在1999年,我們其實是可以購買奔騰CPU,並將其組裝到自己的個人電腦上的,只是我們自己組裝的一般只有一個CPU核。在 ASCI Red之前的超級計算機均是採用為超算專門設計製作的CPU芯片,造價不菲。當然,裝下這麼多CPU的超級計算機佔地面積也非常大,共150平米。奔騰CPU的製程為350納米。

ASCI Red實拍 來源:wikipedia

再來看看現在最強的手機,以2018年發佈的蘋果iPhone X系列為例,這款手機搭載了目前計算力最強的A12芯片。

比剛才提到的奔騰CPU更為先進的是,這款A12既有CPU又有GPU,而且是7納米制程的。其中,A12包含的2顆CPU核心速度為2.49GHz,比剛才提到的奔騰快十倍;GPU則有並行加速效果,要知道1999年,專門生產GPU的NVidia才剛成立不久。

所以看起來,A12這款芯片各個指標完爆超算搭載的奔騰。但要注意,手機上的芯片並不是為科學計算而生,A12主要是為了放在iPhone和iPad,而人們使用這些設備一般就是聊聊天上上網,計算最密集的任務也就是玩玩遊戲,做做視頻了,手機上的芯片不能進行科學計算。剛才提到,衡量超算時,一般使用FLOPS,每秒浮點運算數。A12並沒有提供這個數據,A12提供的數據為:每秒可進行5T個8位運算。儘管這個5T比ASCI Red的1.3T數字更大,但是這只是8位運算,而奔騰是32位運算,兩者的精度差距很大。可以理解成A12的小數點後保留了兩位,奔騰的小數點後保留了幾萬位,畢竟我們不需要在手機上模擬一次核聚變吧。所以但從單個芯片上來講,A12在很多方面確實比奔騰優秀幾十倍,但是從整體看來,A12不能做超算所專注的科學研究。

儘管上面比較是有些牽強,但也反應了芯片行業20年的發展:製程上從350納米縮小到7納米,單位面積上的電路增多了五十倍,主頻從200MHz提升為2.5GHz,並在一塊小芯片上融合了多個CPU和GPU。隨著技術的發展,現在的超算也採用了主頻更快的CPU和GPU,且將成千上萬個芯片融合到一個系統中,對外提供超強的算力支持。

小結

金庸武俠系列中,我們很難比較掃地僧和張三丰誰更厲害一樣,我們也不能將歷史上不同時間節點上的兩個事物拿來比較,因為每個時間點上的事物都有其歷史意義。按計算任務來說,20年前的超算解決的問題更復雜,按技術成熟度來看,現在的手機芯片技術更成熟。


皮皮魯的AI星球


我不懂超算,但是工作過程中有幸接觸過一次,當時是個工業項目,請了一個瑞典技術團隊,對一個部件的成型和模具設計進行模擬,這個公司同時也是瑞典軍方的供應商,賣點就是用當年模擬核試驗的一套軟件和瑞典某大學的一臺大型機進行模擬,模擬精度極高。

我覺得他們那個應該還算不上頂尖的超級計算機,應該就是幾十年前的水準。

可是他們把運算結果導出來之後,只是展示結果,不是運算,光展示模擬結果,筆記本就卡得要死,就一個模擬的動畫,十幾G,我們想把那一段影像拷貝到手機或者平板上,都做不到,最後只好是在電腦上錄視頻,把這一段轉成了視頻。

由此可見,大型計算機的運算能力還是很牛的,至少現在,我們手中的小數據終端,像手機電腦之類的,還都完全比不上。


punkfox


這個問題很有意思啊,忍不住來答一發了。前面有回答說超級計算機和手機有許多不同點,不具有可比性,但它們都是電腦,都遵從馮.諾伊曼架構,而且超級計算機有一個衡量計算能力的指標,即每秒浮點運算速度,簡稱FLOPS。

至於20年前的超級計算機,我想起IBM公司的深藍超級電腦。深藍最轟動業界的事,是在1997年5月11日打敗當時世界排名第一的國際象棋大師卡斯帕羅夫。

深藍在1997年超級電腦排行榜上排第259名,每秒可以完成113.8億次浮點運算,看起來很恐怖是不是?但在目前智能手機SOC芯片面前,這點算力簡直不值一提:

  1. 驍龍855的浮點運算能力大約為每秒7萬億次,是深藍的615倍多;

  2. 蘋果A13芯片的浮點運算能力大約為每秒20萬億次,大概是深藍的1757倍;

  3. 麒麟990具體浮點運算能力缺乏相關數據,但應該在驍龍855和A13之間;

為何小小的手機芯片能打敗20年前的超級電腦?除摩爾定律的威力外,還有一個重要原因是,超級電腦對浮點數的運算更依賴CPU中的浮點運算單元,但其浮點運算能力相對於GPU、NPU是不夠看的。

GPU、NPU採用的是單指令多數據/線程(SIMD/SIMT)的並行化計算,架構上採用眾核架構,而且一個處理器支持多個硬件線程,相對於傳統CPU的單處理器單線程架構,效率要高得多。

打個簡單的比方,一個博士生做四則運算雖然速度不慢,但肯定比不過上百甚至上千個小學生同時做四則運算的速度。這就是CPU的單處理器單線程架構浮點運算效率比不過眾核多線程架構的GPU的原因。

但是,這裡必須要強調一點,CPU的浮點運算單元是專為高精度浮點運算設計,而GPU雖然浮點運算效率高,但處理的數據精度有限,比如英偉達和AMD的GPU支持的數據精度大多是單精度(FP32)和雙精度(FP64)浮點運算,至於手機中的NPU(神經網絡處理器),處理的數據精度更低,只支持半精度(FP16)浮點運算。

正因為如此,超級電腦提高性能一般採用高性能CPU,而不採用高性能GPU,因為流體力學、量子力學等科學領域需要高精度的浮點運算,必須由CPU完成。

總之,單純從浮點運算效率上講,目前手機的SOC芯片完虐20年前的超級電腦,但論浮點運算精度,兩者就沒有可比性了。


魔鐵的世界


1999年的超算造價再怎麼樣花個好幾億美元稀鬆平常,但計算機發展也非常快,要比的話,估且拿摩爾定律測算下。

十八個月價格降一半,20年算降了14個一半,也就是2的14次方分之一,算下來大概16384分之一。電腦現在算2000塊錢人民幣,算下來相當於20年前3200萬元人民幣(500萬美元)的計算機。

由此可以初步得出現在一般電腦大概相當於20年前500萬美元的小型機。從現在一些個人電腦的使用來看,比如3D建模,渲染等,現在用個人電腦能完成的運算量,20年前一般得用小型機才能完成,我覺得這個測算比例基本靠譜。

手機的話比電腦算力差些,估計相當於20年前一兩百萬美元的小型機吧。想和20年前幾個億的超算比,我看現在的手機還差著好幾百倍。


旺德福849


沒有可比性,別被它那5t騙了,真實應用,沒多少機會用八位的加乘。它沒公佈浮點運算力,但大概還能猜出來。八核2.4g,簡單指令集,再怎麼樣也不可能比過i9的複雜指令集的處理能力,而i9的浮點運算能力是1t,還比不過20年前的超算1.3t,所以現在的手機芯片不可能比得上20年前的超算。另外簡單指令集和複雜指令集真實性能差很遠,別看加乘性能差不多,比如判斷字符串長度,i9三指令能處理16字節,20年前超算的芯片四個指令能判斷8個字節,一般的手機芯片四個指令只能判斷兩字節,所以簡單指令集的浮點處理能力不能簡單和超算比,就算公佈了運算力,沒兩倍以上的差距真實性能也比不過超算。


高科技讓人煩惱


差不多吧,當時製程很大,效率非常低,甚至使用的都不是現在的大規模集成電路,所以設備本身功耗高、效率低、計算速度慢。目前的手機處理器已經達到了2GHz時鐘水平,7nm製程,就憑這兩點,就足夠碾壓當時的超算了(當時其實也不算是超算,只是大型計算機而已)。而且最早的電腦程序是通過紙帶輸入的,不是現在這種放在內存裡去固定地址取就可以了,讀取和解譯本身也會花費時間,在效率上無法相提並論。


榻榻米的榻榻


別胡扯了還超級電腦,20年普通電腦都比手機好一點。20年前電腦即是windows98一般只有一核,少量2核。硬件與手機相差無幾,但是電數據共享機制,無論打開多少個,相同數據內存只有一個,在代碼執行上比手機快得多


用戶3485422457492


這根本不是一回事,不存在比較的可能。就好比現在的手槍和三十年前的導彈比,合適嗎?芯片內容可是複雜的很,不同設計意圖和功能沒辦法比較。


趣雅俗客


某些方面完爆那時候的超算,畢竟核心頻率擺在那裡不是用來好看的,其他的就不好說了,畢竟超算核心巨多,再垃圾的主頻架不住核心多!


腦袋蟲


沒有可比性,超級電腦說的是並行執行能力,而現在的手機電腦大部分也只是多線程而非並行。舉個例子,二十年前的超級電腦就是幾百座獨木橋,而現在手機可能就是雙線高鐵。不大好比較,因為執行的程序任務完全不同。


分享到:


相關文章: