六年磨一劍,尋找最強芯:AMD 絕地求生背後的故事

六年磨一劍,尋找最強芯:AMD 絕地求生背後的故事

在科技領域,幾乎沒有什麼“賭博”,能像花費數十億美元從零開始構建一個新的計算機處理器那樣大。前AMD董事會成員羅伯特·帕爾默(Robert Palmer)把它比作俄羅斯輪盤賭:“你拿槍指著自己的頭,扣動扳機,四年後你才會發現你的腦袋會不會炸開。”六年前,AMD上了膛,扣動了扳機,為了避免自己製造出來災難,在內部進行了重組。現在我們已經看到了結果,它沒有死亡,AMD有了一個新CPU微架構Zen,這是令人震驚的Ryzen系列處理器的基礎。事實上,它們非常出色,以至於可能會對英特爾現有的統治地位構成真正的挑戰,並改變未來幾年計算機市場的面貌。

今年1月,在拉斯維加斯的消費電子展(CES)上,我與兩家公司打了照面,它們的情況非常不同。英特爾的所有時間似乎都花在了為幽靈(Spectre)和熔燬(Meltdown)的道歉上,這是一系列災難性的安全漏洞,影響到了該公司的每一個CPU。在接下來的幾個月裡,它基本沒有時間去宣傳它在接下來的幾個月裡將要發佈的所有酷炫的東西。與此同時,AMD則像一隻孔雀——揮舞著羽毛,宣揚它打算繼續進行CPU史上最具侵略性的發佈。

“我認為與一年前相比,他們(AMD)的表現非常成功,”格韋納普在談到AMD時表示。因為就在一年前,這家公司的狀況還很糟糕。根據格韋納普提供的數據,AMD去年僅佔服務器市場份額的1.5 %。英特爾佔據著其他的98.5 %。當然,AMD製造的芯片為每一個Xbox One和PS4提供動力,它也是蘋果電腦的GPU的獨家供應商,但對任何關注的人來說,AMD看起來確實是活在之前影子中。畢竟,該公司曾經被認為是英特爾在CPU領域的唯一嚴重競爭對手,在Zen宣佈之前,AMD在這方面幾乎一直保持沉默,實際上是在向數十億的芯片市場屈服,而這些芯片可以充當從計算機、到為你喜愛的網站提供動力的服務器等一切產品的大腦。

六年磨一劍,尋找最強芯:AMD 絕地求生背後的故事

AMD在CPU領域的最後一次重大突破,是在2011年推出了一款名為Bulldozer的微架構。我們放到行業中看,這一年,蘋果推出了iPhone 4s,英特爾推出了第二代核心架構。英特爾現在已經進入第八代,預計將在今年年底推出第九代。自從英特爾和AMD成為直接競爭對手以來,已經有數十年了。

AMD花了這麼長時間,才重新競爭的最大原因是,上一次大規模的CPU發佈是災難性的。“這並不是說有人設計了一些他們認為不會成功的東西,”Moor Insights & Strategy的創始人兼首席分析師帕特里克·摩爾海德( Patrick Moorhead )告訴Gizmodo 。在成為分析師之前,摩爾海德在AMD擔任副總裁近10年,並在Bulldozer上市的同時離職。

摩爾海德表示,Bulldozer一直是一種高辛烷值的CPU,憑藉其高時鐘速率(或稱時鐘速度)超越了英特爾競爭對手。時鐘速度越高,一個CPU在一秒鐘內可能進行的處理週期就越多。根據摩爾海德的說法,AMD計劃的時鐘頻率為5 GHz,即每秒處理50多億次。當時英特爾的競爭對手推出的CPU時鐘頻率低得多,只有少數產品能夠達到4GHz。

“這就是為什麼人們說‘哦,我們沒有從Bulldozer中得到我們想要的東西’,因為這應該是一個非常高頻的部分。”摩爾海德說。事實上,在AMD或英特爾一般的芯片生產中,從未出現過5 GHz或更高的時鐘頻率。使用如此高的時鐘頻率投入生產的唯一CPU是2012年發佈的專門供IBM大型機使用的IBM zec 12。

Bulldozer投入生產時,其基準時鐘頻率僅為4.2 GHz,渦輪時鐘速率(處理器需要快速處理少量數據時即可啟用)為4.5 GHz。而在相同領域中,令人尊敬的時鐘速率並無法與英特爾的產品競爭。評論家的反應是殘酷的。

Anandtech的阿南德·希姆皮(Anand Lal Shimpi )寫道,他“不確定它是否已經為黃金時段做好了充分的準備”,而且“Bulldozer根本就不能工作”。Tom’s Hardware注意到,它經常被前任“擊敗”,而Tweaktown則哀嘆道,“你不得不對今天發生的事感到失望。”

當CNET對Bulldozer的評論進行了一輪討論時,它報道稱,“Bulldozer似乎沒有給 AMD 帶來競爭性的復甦。”但至少有一點希望,能讓AMD能留在CPU領域。

然而,後續情況愈加糟糕。在每一年的迭代過程中,AMD 從門口走出來的時候,它和英特爾之間的差距都會變得越來越大。格韋納普告訴Gizmodo,該公司試圖“從一些效果不好的東西開始,然後試圖把它拼湊起來,使它變得更好。”但是每一個新的迭代,都是基於性能已經表現不佳的Bulldozer架構,它無法跟上。“它從未真正具有競爭力過。”

這需要勇氣

CPU必須具有競爭力——成本更低、速度更快或能效更高。它是核心大腦,為你使用的每一臺電腦提供動力——從手機到筆記本電腦,再到電視。它是一個硅晶片,然後有數十億個微電路蝕刻到它的表面,並通過銅離子相互連接。CPU的硅微電路(或晶體管)通過銅進行排列和連接的具體方式稱為“架構”。

1971年,英特爾發佈的第一款微處理器Intel 4004是在一個只有10000納米的芯片或基礎上製造的。那就像一根很細的頭髮一樣。Ryzen CPU只有14納米。這意味著它可以更快地在這些銅離子之間移動能量——實際上CPU越小,它就能越快。但是CPU越小,它就變得越精緻。因此,為了製造速度最快、功能最強大的處理器,CPU設計人員還必須使它們更小、更復雜。這意味著始終優化和尋求更好的效率。

因此,每個CPU被設計用於特定的“指令集”。這是在CPU和設備軟件之間工作的最基本的代碼。常見的CPU指令集是ARM和x86。ARM CPU通常出現在手機和平板電腦中——為三星GalaxyS9和iPhone X提供動力的CPU是基於ARM的處理器。x86 CPU通常保留給需要更多電源和更少電池壽命的計算設備。英特爾和AMD的筆記本電腦、臺式機和服務器的CPU是x86,除非特別說明,AMD的競爭對手也是如此,包括其新一批Ryzen處理器。

除了指令集CPU之外,它實際上非常簡單,僅由幾個關鍵組件組成:內核、CPU緩存和系統總線。內核是CPU的引擎,它們執行所有實際處理的工作,當你談到CPU的時鐘頻率時,你談到的是這些內核的運行速度。內核執行CPU所需的所有實際處理,但它們忙於處理你提供給它們的所有數據,因此需要緩存其中的位(bits),以便快速引用。

這就是CPU緩存的來源。它們是記憶。你瀏覽你計劃購買的計算機的規格說明時,你可能會看到提到這些緩存,通常標記為L1、L2和L3。它們之所以重要,是因為它們是內核在處理數據時實際讀取和寫入數據的對象。這些數據在CPU高速緩存中處理後,會被髮送回計算機的通用內存(也稱為RAM ),然後可能會被髮送到存儲驅動器上,所有這些數據都會通過圖形處理單元到達你的眼前。

CPU高速緩存和內核通過系統總線彼此通信。它被稱為總線,因為它本質上是在將信息從CPU的一部分傳輸到另一部分。有時,這不僅僅是在內核和CPU緩存之間移動數據。如果圖形處理器被壓縮到同一個芯片上,系統總線也會將數據移入和移出圖形處理器。在它最初級的時候,把一個系統總線看作是你用來把所有的樂高積木卡在上面的綠色小板。

系統總線種類繁多,各大CPU製造商都有自己的系統總線架構。英特爾擁有所謂的Front Side Bus,在Zen之前,AMD使用了一種叫做HyperTransport的技術。

現在,集中於這些組件中的任何一個都可以提高CPU的速度。當AMD製造Bulldozer時,它把所有的精力都投入到了CPU內核的時鐘上。時鐘頻率是計算機處理單元實際處理數據週期的頻率。更多的進程意味著更快的CPU,在很長一段時間內,提高CPU的時鐘頻率是設計人員的主要目標。

但在本世紀初,英特爾推出了一款時鐘頻率為3 GHz的CPU,此後幾乎所有的CPU都圍繞著這個時鐘頻率徘徊。時鐘信號延遲增加的原因之一是時鐘信號越高,CPU產生的熱量越多。除去所有的熱量可能會很昂貴——尤其是如果你想把CPU包裝成超薄無風扇的產品的時候,比如Surface Pro。

因此,近年來,CPU設計人員已經將CPU的其他部分轉變為提高速度,當AMD決定基本上廢棄Bulldozer,並將其大部分資源投入到即將到來的Zen中時,CPU的一個特定組件將首當其衝地成為焦點:一種新的系統總線體系結構,稱為Infinity Fabric。

但是,在AMD決定採用Infinity Fabric之前,甚至說,在它決定創建一個新的CPU並承認Bulldozer的故障之前,該公司需要一個新的CPU設計團隊。

六年磨一劍,尋找最強芯:AMD 絕地求生背後的故事

將力量結合在一起

現任的AMD 首席技術官是馬克 · 帕爾馬斯特(Mark Papermaster)。他在2011年末加入了公司,就在Bulldozer推出後不久,據他說,“這不是巧合。“帕爾馬斯特被請來幫助拯救一家股價在一年內暴跌60 %以上的公司,部分原因是Bulldozer的糟糕表現。

在加入AMD之前,帕爾馬斯特主要因為兩件事而引人注目。2008年,他成為了 IBM 公司一起廣為人知的訴訟的對象。1982年以來,他一直在IBM工作。IBM擔心帕爾馬斯特 (當時是蘋果公司的一名新員工)可能會把商業秘密從IBM帶到蘋果公司。最後,這個案子在庭外和解了。2010年,帕爾馬斯特再次登上了頭條,據報道,由於與時任首席執行官史蒂夫·喬布斯( Steve Jobs )的分歧,他在僅僅15個月後就離開了蘋果。

2011年10月,帕爾馬斯特加入AMD,該公司當時似乎處於自由落體狀態,高通、蘋果和三星等主要競爭對手紛紛挖走了不滿的員工。僱員的離開使一些人感到不安。AMD創始人傑裡·桑德斯( Jerry Sanders )在2012年2月接受《福布斯》採訪時說:“這讓我很傷心。”

公司處於混亂之中,帕爾馬斯特自己也在為此做出貢獻。不是因為他以前的聲譽,而是因為他的第一個任務就是大幅重組CPU設計團隊。他看到Bulldozer的性能有多差時,他很清楚,這不是AMD獲取成功所需要的處理器。“我看到市場將會有很高的表現,”他告訴Gizmodo 。“為此,我們需要一個新的CPU。”帕爾馬斯特確信市場需要一種可以處理遊戲、處理大型3D文件或渲染大型4K視頻的設備,而不是隻處理web瀏覽的設備。

對於帕爾馬斯特來說,新的CPU意味著對AMD設計團隊進行重大重組。傳統上,CPU設計團隊分為兩個基本團隊。多倫多大學電氣與計算機工程教授娜塔莉·傑格(Natalie Jerger )告訴Gizmodo說:“在Zen架構之前,他們確實有兩個平行的設計軌跡。”其中一款處理器專為低功耗筆記本電腦和臺式機設計,是最便宜的。另一個用於服務器和高端臺式機。服務器級處理器是Bulldozer,低功率CPU被稱為Bobcat系列。

AMD公司副總裁兼產品首席技術官喬·麥克裡(Joe Macri)告訴Gizmodo :“帕爾馬斯特的做法是將這兩個團隊合併在一起。”麥克利是這個新的、更大的團隊領導者之一。

聽他這麼說,這兩個團隊合併(並裁掉多餘的人),似乎是帕爾馬斯特開展工作的必要條件。“我們不需要從頭開始,”麥克利說。“因此,這實際上是一次合併,而不是將現有團隊拆分,然後重新組合在一起。但是在這個過程中,我們的效率得到了提升。我們能夠將更多的人應用到單個功能中,並獲得更多的‘設計帶寬’。”帶寬是實現帕爾馬斯特的目標所必需的,即構建一個在各方面都優於剛剛發佈的垃圾的CPU。

帕爾馬斯特很快得到了AMD另一位新高管的幫助:麗莎·蘇( Lisa Su ),她於2012年1月加入AMD,擔任高級副總裁兼總經理。蘇來自另一家CPU製造商Freescale,該公司後來與恩智浦半導體合併。她首先關注的是AMD的圖形和遊戲市場——該公司在這方面確實取得了一些成功。蘇和時任首席執行官羅利·裡德( Rory Read )與索尼和微軟達成協議,為Playstation 4和Xbox One製造芯片。

這些交易是巨大的,許多消息來源援引AMD為索尼和微軟定製芯片的工作,作為該公司在CPU“乾旱”中倖存下來的原因之一,並以其當前的架構Zen實際上成功地生產出瞭如此有效的CPU。

蘇的工作很快就引起了注意,到2014年10月,在她加入AMD兩年多一點後,她被提升為首席執行官。蘇、帕爾馬斯特隨後開始為 Zen 的發展投入資源。據麥克利說,在過去的四年裡,超過了兩百萬個工時。

對於帕爾馬斯特來說,將所有這些資源投入到一個新的CPU設計中,並讓這個團隊有效地忽略Bulldozer及其後續的迭代是絕對重要的。他需要一個有喘息空間的團隊,來獲得他們所擁有的那些聰明的想法。“他覺得AMD對於新的CPU的一些最酷的想法已經被擱置了,因為在新的修訂之後有如此苛刻的新修訂時間表。”

“你知道有時候你可以得到一個‘讓我們從頭開始,把一切都扔掉的設計’。團隊沒有這樣做。“相反,這個團隊從 AMD 廣泛的後備目錄中抽出一些多年來沒有得到很多關注的想法。其中一個想法是改進系統總線體系結構HyperTransport,並創建一個新的架構: Infinity Fabric。

馬克·帕爾馬斯特告訴Gizmodo,AMD稱之為“隱藏的寶石”,吉姆·安德森(Jim Anderson)告訴Gizmodo,這是“秘密的調味料”。

Infinity的關鍵先生

這就是一位名叫吉姆·凱勒(Jim Keller)的天才工程師進來的地方。在AMD內部,他是一個神話般的人物。我採訪過的幾乎每一個人,都提到凱勒是Zen設計成功背後的主要人物之一,也是Infinity Fabric 設計背後的重要人物之一。

帕爾馬斯特在2012年聘請凱勒,讓他負責處理器組。凱勒對AMD並不陌生。上世紀90年代,他曾在那裡工作過。他短暫的任期,在網絡極客處理器領域獲得了傳奇般的地位,他被認為是AMD K8微架構背後的主要人物,該架構使AMD在90年代末和2000年代初與英特爾展開了激烈的競爭。

凱勒和帕爾馬斯特曾一起在蘋果工作,大家都認為,凱勒為蘋果的iPhone和iPad設計了第一個CPU。當他來到AMD時,他和他的新僱主都同意簽訂一份有限期的合同。他將在AMD工作三年,在合同結束後,他將離開。他現在為特斯拉汽車的自動駕駛功能設計芯片,並拒絕就此事置評。(最新消息:英特爾宣佈吉姆·凱勒已經加入該公司作為硅工程的SVP。情節變得更復雜了!)

凱勒,特別是他在移動CPU方面的工作和之前在 HyperTransport 上的工作是關鍵。來自AMD高管都對他熱烈讚揚,如馬克·帕爾馬斯特和吉姆·安德森,以及來自分析師林利·格韋納普,他們說:“我認為吉姆和他的團隊真的從技術角度扭轉了公司的局面。”

2014年,在一次罕見的公開採訪中,你可以感受到凱勒的熱情和動力。“我加入AMD是因為我喜歡處理器設計,我喜歡複雜的系統設計,而AMD正著眼於在下一代產品上取得巨大進展,”凱勒說。

凱勒看起來很冷靜,在小舞臺上表現得很優雅,當他談論架構、管道和內核以及我們大多數人都會打哈欠的其他極其技術性的東西時,他會變得越來越敏銳,越來越活躍。

這次採訪是對2014年的Zen的一個很好的展示——距離發佈還有三年。當時,它剛剛開發了大約兩年,並且仍與K12 ( AMD計劃的下一代ARM CPU )一起設計。在採訪中,凱勒實際上將這種協同開發稱為Zen的資產,特別是每個Zen CPU內核的資產。

然而,凱勒直到15分鐘會話接近尾聲時,才提到最重要的組件,他提到了下一代“Fabric”,這可以在從移動設備到服務器的每個CPU中找到,並允許AMD以令人羨慕的速度擴展性能。到2017年,這種Fabric將被稱為Infinity Fabric。

他解釋說,這種結構將允許AMD採用“chiplet”方法進行設計。AMD可以將一系列處理器封裝在一起,而不是在單個芯片上構建一個處理器——通過Infinity Fabric系統總線連接它們。這將使CPU的生產成本更低,理想情況下與CPU一樣快,就像AMD以前的CPU和大多數來自英特爾的CPU一樣,包括一個管芯上的所有內核。

“從歷史上看,”分析師帕特里克·摩爾海德告訴Gizmodo,“當你把東西包裝在一起時,它會減慢這個過程。但是,AMD已經找到了一種方法,讓這種封裝設置具備非常高的性能。”

這種封裝還意味著AMD正在設計一種與競爭對手截然不同的CPU,根據AMD的說法,這種CPU採用了一種不同的、效率更高的方法。“我們想出了一個非常規則的結構,”喬·麥克利告訴Gizmodo。“我們基本上有一個數據點和一個控制點,每個人都以同樣的方式連接到Infinity Fabric 。”

麥克利聲稱, Infinity Fabric實際上加快了處理器的設計。它給Zen架構的模塊化設計,意味著AMD不需要為每一種CPU重新發明輪子。“設計內核的最大挑戰之一是實際驗證它,”麥克利說。得益於Infinity Fabric,AMD能夠快速驗證或確認一系列稍有變化的設計,這些設計涵蓋了Zen處理器的全部產品。

把Infinity Fabric想象成樂高積木中的小折扣,把CPU的所有組件想象成積木本身。AMD可能只需要幾個塊來構建臺式機CPU,或者使用更多塊來創建大的多核服務器處理器,或者使用GPU來製作專為筆記本電腦設計的超高速芯片。

或者,就像在2016年發生的那樣,AMD 是一種全新的 CPU。

六年磨一劍,尋找最強芯:AMD 絕地求生背後的故事

突破性進展

2017年發佈的Threadripper,可能是AMD在Zen基礎上推出的最引人注目的CPU,它從未出現在帕爾馬斯特咄咄逼人的路線圖中。相反,這是一個非常小的工程師團隊的激情項目——可能有四個人。APU和CPU的AMD佈道者羅伯特·哈洛克(Robert Hallock)說,這是一個“非常非常小的團體”。他和他們共用同一排小隔間。

該公司曾一度想做一個真正強大的臺式機CPU,但從技術上或財務上來說,它都是不可行的。然而,這一小部分工程師意識到,他們可能會利用Infinity Fabric提供的小芯片設計,構建一個功能強大得令人難以置信的臺式機CPU,與英特爾廣受歡迎的高端至強CPU相抗衡。然而,Threadripper 將不再使用 Xeon 處理器上的8個內核,而是16個——這是大規模生產的臺式機CPU中放置內核最多的。

這樣的CPU應該需要數年的時間來設計、測試和推向市場,對嗎?據吉姆·安德森說,這個小團隊直到2016年1月才與他接洽,當時他們在拉斯維加斯的消費電子展上將他拉到一邊。他說,他立即意識到這些芯片的絕對酷炫的因素,並堅持把項目放在一個快速的軌道上,從他們的概念到生產僅僅花了一年多一點的時間。

這個項目被嚴格保密,只被稱為 Summit P3——許多人認為這是Ryzen的一個小分支——然後稱之為Summit Ridge,根據哈洛克的說法,“你甚至不被允許發送關於這個項目的電子郵件”。從外觀到速度結果,一切都受到嚴密保護,直到發佈。甚至連試圖說服戴爾等PC製造商採用CPU的團隊,也幾乎沒有產品本身的詳細信息。

然而,當Threadripper終於在2017年夏天推出時,震驚了批評家和消費者,並很快被世界上一些最大的PC製造商採用,包括Alienware等頂級遊戲臺式機。

但引起人們興趣的不僅僅是 Threadripper 大膽的設計。是的,在任何人都能構建的臺式PC上運行32個線程的16核處理器,給人留下了深刻印象,但Threadripper推出兩週後,英特爾宣佈推出18核i9處理器。不過,令人驚訝的是,Threadripper 很便宜——英特爾18核處理器的價格從1000美元到2000美元不等——而且它的速度也一樣快。

六年磨一劍,尋找最強芯:AMD 絕地求生背後的故事

最重要的是,這讓觀察人士對AMD最新的CPU架構感到驚訝:這些芯片比英特爾的競爭對手更便宜,而且通常更快。

然而,AMD不僅僅是生產快速、廉價的處理器,它還以驚人的速度突然發佈了這些處理器。2017年,AMD發佈了基於Zen的四種類型的CPU : Ryzen臺式機CPU、Threadripper、面向服務器的Epyc CPU和麵向筆記本電腦的Ryzen APU ( APU是AMD對集成顯卡的CPU的稱呼)。2018年剛過去四個月的時間,AMD已經發布了速度驚人、價格低廉的臺式機APU、更多的筆記本電腦移動APU,甚至還有第二代臺式機Ryzen CPU。

吉姆·安德森告訴Gizmodo,他預計到今年年底,將會有60多臺內置Ryzen的新筆記本電腦和臺式機推出,其中大部分是筆記本電腦,大部分將在未來幾個月推出。“這將是您在AMD公司歷史上見過的最廣泛使用的高端筆記本電腦系統。”

這些筆記本電腦有多好還有待觀察。到目前為止,市場上實際上只有少數基於AMD的筆記本電腦,與英特爾等競爭對手相比,我們仍然不太清楚移動Zen處理器的處理能力。

英特爾已經清楚地注意到AMD在CPU領域的進步,並做出了相應的回應。去年,英特爾的頂級臺式機CPU達到4核,但在AMD發佈6核處理器後,英特爾迅速做出了反應,推出了自己的6核設備。當AMD用16核Threadripper 讓我們大吃一驚時,英特爾立即將18核i9推向市場。

兩家公司之間的競爭,只會對我們所有人尋找下一臺電腦有好處。“你知道,”娜塔莉·傑格告訴Gizmodo,“如果我們有很多個人試圖在這個領域進行創新,世界將會更加令人興奮。”


分享到:


相關文章: