專訪AMD首席技能官CPU晉級週期為12至18個月

專訪AMD首席技能官CPU晉級週期為12至18個月


1月1日消息,據外媒報道,在異常忙碌的2019年背後,芯片巨頭AMD正獲得更多市場佔有率,現在它是許多CPU細分市場上高性能產品的領先者。該公司不僅自家產品表現出色,而且在其主要競爭對手所面臨的製造和生產問題方面也表現上佳,這在某種程度上預示著AMD已經成熟,能夠最終靠大量的勝利來拓展邊界、獲得市場佔有率和建立聲望。

2019年,AMD推出的Ryzen 3000 CPU和EPYC Roman CPU都採用了基於臺積電7 nm工藝的新Zen 2微架構,如果兩家公司沒有在高性能產品方面做深度合作優化,這是不可能實現的。AMD也在與企業原始設備製造商(OEM)建立親密關係方面取得長足進步。AMD首席技術官馬克·佩珀馬斯特(Mark Papermaster)日前接受專訪,談及該公司新品發佈時間表和未來產品,與臺積電和三星的合作伙伴關係,推動建立行業標準等。

以下為採訪摘要:

關於AMD發佈時間表與未來產品

問:到目前為止,AMD的新產品幾乎每年都在增加新的內核。其路線圖顯示Zen 3幾乎準備就緒,Zen 4正在開發中,Zen 5更進一步。這種節奏可持續嗎?

佩珀馬斯特:我們正處於12-18個月的發佈節奏中,我們相信這是可持續的。這也是業界對我們的要求。

問:AMD最近取得的成功,比如增加關鍵領域的市場佔有率和推動審查,是給你們提供更好的機會來加快發佈節奏,僱傭更多的員工,還是不可避免地會導致新想法的形成,從而減緩發展速度?

佩珀馬斯特:我們所處的位置有其自然的節奏,我們有多個設計和執行團隊參與其中。當一支隊伍完成自己的工作時,另一支隊伍就會立即接手。你知道,我認為這種節奏很適合我們,因為在某些市場,你對每年都會有新產品的期望正逐漸增加,比如智能手機。在這樣的市場,你必須抓住每年的假日季,幾乎每次更新都要增加新的內核,在很大程度上,他們能做到這一點。但是每年都需要在同一時間完成任務,這就從另一方面代表著可能還會有些核心任務需要加速完成,而這將會發生在每一次迭代中。因此,我們相信,我們正走在正確的軌道上,以便向客戶交付高性能的產品,這是我們幫助AMD復興的基礎。

問:你能談談Zen 4及其之後的路線圖制定情況嗎?通常,當我們談到這些路線圖,即今後3年至5年或7年的路線圖時,公司的規模往往決定了長期願景。在過去的幾年裡,AMD在推廣其三年時間跨度路線圖方面相當積極。

佩珀馬斯特:我們公開分享的當前路線圖,展示了我們的軌跡和我們為開發當前這一代技術正在做的事情,但也顯示了其後的路線圖線索。你知道,我們有團隊著眼於幾年之後的願景,但我們並未真正公開談論我們對那時的預期。與我們幾年前的做法相比,AMD最大的變化是我們有多個不斷跨越的設計團隊,這有助於我們在12到18個月的週期內持續保持創新過程,花時間確保我們提出的硬件具有合適的性能。如果由於產品上市時間的限制,我們一定要完成設計,那麼不適合這個窗口實現的想法就會直接進入下一代設計中。

問:最近對AMD高管進行採訪時,他們將當前的路線圖描述為“鐘擺模式”(tick-tock model),即基於英特爾過去十年的運營模式,你對這種說法有同感嗎?

佩珀馬斯特:我不知道你提到的那次採訪,但我要說的是,我們並未採用“鐘擺模式”。我們正在做的是研究每一代CPU,並將已經存在的、最好的進程變量與正確的IPC(CPU在每時鐘週期內所執行的指令數量)改進集、內存層次結構以及我們大家可以放在其中的所有東西結合在一起。我們致力於保持每一代CPU都能以最好的速度進步,這是個對我們AMD很有效的公式。

問:我們是否應該期待Zen 2會有更新,就像Zen 2+或Zen 1那樣?

佩珀馬斯特:我對當前設計的任何更新沒什麼可說的,但我們總是關注它在哪裡有意義,在哪裡我們也可以抓住機會在性能、功率或芯片面積等方面加以改進。

IPC和性能提升

問:在最近的財報電話會議上,蘇姿豐(AMD總裁兼首席執行官)提到,AMD的發展並不總是依賴於從臺積電獲得最好的工藝節點優勢,跟著時間的推移,你們公司將推動架構改進。為了推動領導層支持這兩代技術更迭並進入Zen 2及以後的時代,你始終在積極推動微體系結構IPC性能提升,隨著我們進入內核數量增加、回報遞減的時代,這本身是否可持續?

佩珀馬斯特:所以很明顯,業界已經想好了如何利用持續不斷的增加的內核。作為CPU供應商,你必須對此進行管理,因為你不能以比軟件所能利用它的速度更快地增加內核數量!但我們顯然在CPU和GPU上增加了更多的引擎,這些特定的硬件引擎仍將是未來的一股力量。現在顯然必須在內存和IO之間取得平衡,我們一定要能夠提供一個平衡的系統。在AMD,我們非常清楚這一點,這也是我們將繼續做的事情。

問:推動新一代硬件,特別是處理器體系結構的一件事是對ISA和新指令的改進。但是,由於我們也看到特定的加速器被捆綁在套餐上,還有額外的安全硬件等等,AMD將如何推動該行業向前發展?

佩珀馬斯特:如果你看看我們今天的芯片,會發現我們有很多專門的功能。每個AMD芯片都有一個PSP,即平臺安全處理器,如你所知,它是我們硅片中的一個獨立處理器,用於信任根並提供安全服務。我們的內核中也有專為特定數學功能而設計的加速器。我們還有大量的DSP,我們的筆記本芯片已經擁有並將擁有這些DSP,我們的客戶端處理器將在那裡安裝音頻處理器。因此,在硅片上安裝加速器或特殊功能,或者還可以作為芯片,這是一個“何時有意義”的問題。我們在各個細分市場的芯片體系結構中都處於領先地位,因此我們明白,在需要模塊或芯片之前,讓某些東西保持離散狀態或對其進行評估是有意義的。

問:AMD非常自豪今天通過Zen 2在臺式機上擁有IPC性能優勢,但我們繼續看到英特爾突破新ISA指令的界限,例如矢量指令或bfloat16,因為英特爾必須迎合那些邊緣情況和真正想要特定功能的客戶的真實需求。AMD在過去取得了很大的成功,例如推動了64位x86標準。我們能看到AMD成為定義未來x86指令標準的幕後推手嗎?

佩珀馬斯特:我們繼續關注設計的方方面面。如果你看到我們通過Zen處理器系列和內存加密帶來的安全創新,會發現我們推動的功能不需要新的擴展,因為它是在幕後進行的,也不需要驅動一組軟件進行修改。因此,我們著眼於能夠讓最終客戶受益的創新,其中有些創新確實需要延期,因此我們將繼續關注這一點。從x86的整體觀點來看,我們總是在尋找些推動廣泛採用的擴展,如果發生這種情況,我們會將其包括在內。

問:在討論新硬件時,大家最喜歡的話題是增加IPC。對於Zen 2,我們正真看到IPC比上一代有了非常好的提升(15%)。最近我們聽到弗瑞斯特·諾羅德(Forrest Norrod)(AMD數據中心高級副總裁)談到Zen 3,因為我們該會看到IPC再次出現非常典型的提升,在Zen 2的基礎上又進行了一次階梯式的改進。你認為AMD會繼續這樣的改進嗎?

佩珀馬斯特:根據我們的路線圖,正如你所知,我不會詳細的介紹未來幾代更新的IPC提升情況,但我們正在推動一個高性能計算模型,每次迭代都將帶來性能改進。這一切都是關於為我們的內核設計選擇正確的IPC改進集,以及正確的工藝節點和設計規則。當我們設計我們的內核時,總是需要取得平衡,以便將功率和效率相匹配,在AMD,我們仍然期望超過行業標準。我們以前說過,業內單線程性能的年增長率只有7%,而我們的目標是每一代產品都要超越這一速度。我們最近的產品比業界執行得更好,也超出了業界的預期。

問:隨著內核性能的提高,會給內核內部的緩存帶來額外壓力。AMD在緩存大小和延遲方面做得很好,比如當前設計中的大型L2。我們現在面臨的情況是,你們的主要競爭對手將其一級緩存大小增加了50%,以換取內核核心的延遲增加25%,這讓我們大吃一驚。你能談談AMD的緩存設計勢頭嗎?你對此有何看法?

佩珀馬斯特:如你所見,我們從第一代到第二代Zen設計改善了我們的內存層次結構和相關的延遲。我們關注這一點,我不打算預先宣佈Zen 3如何改進,但是緩存設計是我們談論的整體IPC提升的一部分,也是我們關注每次迭代性能改進的一部分。當然,延遲對我們的客戶很重要。

問:自APU Kaveri以來,AMD始終在傳遞的關鍵營銷信息之一是實現25x20的目標:即到2020年底,使其2016年款產品的性能提高25倍。我們一直在密切關注這一目標,而且看起來AMD還有很長的路要走。你對此有何評論?

佩珀馬斯特:事實上,我對我們的團隊如何圍繞這個目標團結起來感到非常興奮。我們的工程師實際上把它稱為目標,但它最初根本不是一個營銷信息。他們利用它作為激勵因素,推動筆記本電腦的所有設計和工藝方面的優勢進入每次迭代中。的確,我們對我們取得的進展感到興奮,如果你看看我們推出的第二代Ryzen Mobile,我認為你看到的是在電池續航時間和性能方面的出色改進。然後,你必須看一看與微軟在Surface Laptop 3上建立的深度合作伙伴關係,這使得更緊密的軟件和硬件合作伙伴關係得以實現,這不僅有利於微軟,也有利於Windows生態系統。這種合作伙伴關係使得AMD的所有移動產品與Windows的電源管理更加緊密。

封裝高帶寬存儲器和半定製設計

問:我們是否處於處理器需要封裝高帶寬內存的時間點?我們正真看到內存通道數量在增加,內存頻率也在增加,我們已從DDR3過渡到DDR4,並在未來轉向DDR5,但仍有一部分市場希望高帶寬內存儘可能靠近處理器。

佩珀馬斯特:沒錯,我們在這個領域已經努力了很多年。我們在AMD率先將HBM帶到GPU上,即硅內插器上使用2.5D封裝技術。關鍵在於為工作負載獲得合適的內存解決方案,而且你還必須達到合適的性價比目標。這是個微妙的平衡,你必須為每一種產品考慮這種平衡。在高性能GPU計算中,HBM是必須的,你可以在我們的MI路線圖上看到這一點。在其他時候,我們總是著眼於正確的解決方案,GDDR和DDR都有正在執行的偉大路線圖,我們已成功地利用了這些技術。我們將繼續進行同樣的工作,查看我們的每一款產品,詢問行業的發展趨勢,每種產品的工作負載要求是什麼,以及每種內存解決方案的成本/性能指標是什麼。

問:我們已看到許多客戶按照AMD路線圖使用你們的CPU和APU實現了GDDR,例如使用小霸王遊戲機和其他類似遊戲機上的芯片。如果HPC客戶真正的需求在CPU封裝上使用HBM,你們會考慮這一點嗎?

佩珀馬斯特:對我們這樣的半定製業務,當客戶有大量機會並希望深入合作以利用我們擁有的構建塊時,如果這對涉及的兩家公司都是個很好的機會,我們就會創建一個半定製解決方案。當這些機會出現時,我們將繼續分析它們。

問:合作伙伴投資半定製芯片需要什麼水平的投資?我知道這是個非常寬泛的問題,但我們正在努力理解某些公司必須投資多少才能獲得半定製設計,是幾百萬,還是幾千萬?當然,只希望出5萬美元的人不會獲得半定製設計。

佩珀馬斯特:不幸的是,我無法回答這樣的一個問題。我們現有的這些類型的協議是保密的。不過你說得對,超過5萬美元!如你所知,如果你想在這些設計上處於領先地位,僅僅製作模具就可能耗資數百萬美元。

問:從我們的角度來看,很難從這些協議中辨別出合作伙伴投入的金額,以及與AMD投入的資金進行對比:如果這是一個獨特的設計,並且AMD認為合作伙伴以外的人也對該設計感興趣,那麼合作伙伴是否也能獲得一筆好交易,或者所有費用都由合作伙伴承擔?這在某種程度上預示著如果他們為所有這些提供資金,他們將不得不賣出100萬到200萬臺才能實現收支平衡,這似乎是不可行的。

佩珀馬斯特:

我不能說太多,但我知道你的意思。我們的半定製協議,即使我們只是在硬件上合作,或者它是整個堆棧,最終都是保密的,這取決於客戶想說什麼。我所能說的是,我們的半定製模式是靈活的、成功的,也是AMD產品的關鍵部分。

計算快速鏈接(CXL)聯盟

問:AMD現在是CXL聯盟的成員,儘管它也是市場上幾乎所有互連標準的成員,而且在過去,AMD始終在推動CCIX。CXL與PCIe 5.0有著緊密的聯繫,那麼你能談談AMD對這些新互聯的期望和部署嗎?

佩珀馬斯特:正如你所知道的,AMD的支持者要求我們與行業保持一致,特別是在IO和加速器的共同標準方面。你說的完全正確,我們加入了CCIX,我們在那裡一直很活躍。但我們在幾乎所有我們參與的組織中都很活躍。我們加入了CXL,我們相信這其實就是個非常強大的、利用PCIe 5.0的聯盟。我們也是PCIe開發工作的有力參與者,因此這與我們的戰略相一致,即利用PCIe BYT還可以通過聯盟制定更低延遲的互連標準,這是行業推動一致性和利用PCIe基礎的最佳方式。這就是推動PHY(物理層)開發的原因,這可能是一筆巨大的開支,但與標準PCIe相比,作為這些標準的一部分,無論是作為加速測試還是內存測試,這都有助於我們攤銷這些成本。因此,我們大家都認為這是個很好的舉措,我確實認為它在行業中的勢頭正在增強。

問:你是否希望CXL在其生命週期內廣泛與PCIe保持一致?

佩珀馬斯特:對此我們拭目以待,並時刻關注這個領域。從歷史上看,這些類型的聯盟通常是從一個更大的標準委員會中脫穎而出的,它們過去已經是一個更廣泛的標準委員會,但現在這樣稱呼CXL還為時過早。

問:對CXL路線圖的一個擔憂在於,將來它可能會有僅支持CXL的加速器,如僅支持CXL的顯卡和CPU,不支持PCIe 5.0,你對此有何看法?

佩珀馬斯特:很高興知道這一點,但我不認為會發生這種情況。任何符合CXL標準的設備也將符合PCIe標準(實際上需要PCIe合作才能啟動協議),因此任何額外的限制都是特定於供應商的。但我們大家都認為這不會發生。

頻率與摩爾定律

問:當轉移到設計類似內核的更先進工藝節點時,其中一個問題是由於電流密度造成的頻率損失。當AMD轉到臺積電的7 nm工藝時,該公司發出了警告,說它如何能夠保持與Global Foundries的14 nm/12 nm設計的頻率對等。與前幾代Ryzen相比,你甚至把這些頻率推得更高了。在行業的其他地方,我們正真看到在最新的工藝節點上保持頻率奇偶校驗很困難。因此,即使PPA(功率、性能、面積)整體上有所改善,AMD如何為未來的工藝節點解決這樣的一個問題?AMD有沒有考慮其他因素?

佩珀馬斯特:我認為當你看所有關於摩爾定律的評論時,你會看到我們都知道並喜歡的舊摩爾定律幾乎是普遍一致的,在每一代更迭中都有頻率提高的情況,以及伴隨著頻率改善而來的功率和麵積的優勢。在這個新領域,摩爾定律並非過時,而是不同於舊的摩爾定律。現在已經有了某種程度的普遍一致性,因為頻率已經不會隨著每個後續節點的變化而調整,我認為我們行業中的大多數人都接受這一點。

在AMD,這在某種程度上預示著我們要制定自己的計劃,這樣我們就可以從整體上看待我們一定要提高業績的所有槓桿。這就是我們在芯片方法上保持創新的原因,我們將其應用到有意義的地方。這就是我們對內存層次結構進行創新的原因,正如我已經提到的,仔細選擇我們為特定工作負載部署的正確內存類型。正是我們已採用這種整體系統的方法,並在我們前進的過程中不斷加以補充,以確保即使在我們所處的摩爾定律的新時代,我們也可以繼續這一努力。

新一代Infinity Fabric

問:AMD的Infinity Fabric(IF)是AMD推動其產品之間進行可伸縮性消息傳遞的關鍵部分,AMD研究員確實樂於談論這一點。當我們轉向新的、更快的連接標準(如PCIe 5.0甚至PCIe 6.0)時,是否會跟上帶寬增長的步伐,或者僅僅是在互聯方面就會耗盡電力預算?

佩珀馬斯特:你標記的內容不僅是Infinity Fabric(這是AMD的協議,也是我們芯片方法的關鍵)的關注點,還有我們整個路線圖的靈活性和模塊化,以便將我們的最新一代知識產權應用到我們服務的所有細分市場。因此,我們為每一代產品遞增並設計新版本的IF是有原因的,事實上,這是不斷增長帶寬並保持整個系統優化所需的創新。你還必須對芯片外驅動的IO和互連執行相同的操作,如PCIe和所有這些SERDES鏈路,它們需要同樣的創新。我認為你正在看到我們的設計方法在邏輯和SERDES上所做的大量工作,無論是長距離實現還是短距離實現。

問:對於每一代新的Zen,我們大家可以安全地認為我們該期待新一代Infinity Fabric與它們兼容嗎?

佩珀馬斯特:那是我的期望。

問:在今天的市場上,我們有使用IF的雙插槽Rome,用於插座到插座之間的通信。我們被告知,GPU系列將在某個時候支持GPU到GPU的無限結構鏈接。我們現在沒有看到CPU到GPU無限結構連接,這是不是有什麼技術原因?

佩珀馬斯特:所以我們在CPU和GPU中都部署了IF,它使我們也可以非常有效地進行擴展。今天,我們在CPU和GPU之間充分的利用,它允許我們使用我們大家可以通過該協議實現的優化元素。我們繼續關注我們大家可以在哪裡利用這一優勢,以及通過IF將AMD CPU連接到AMD GPU的意義在哪裡。

造制合作伙伴關係

問:AMD是臺積電5nm生產的關鍵合作伙伴嗎?

佩珀馬斯特:我們目前還沒有宣佈推出5nm工藝的產品,但我們與臺積電的合作非常密切,你已經看到了我們與他們的那種深度合作,我們的產品線上都有7 nm的產品。

問:已經宣佈AMD正在與三星在移動圖形方面做合作。這是純粹的硬件關係,還是可以延伸到製造領域?

佩珀馬斯特:與三星的合作是一家知識產權合資企業。我們正在與他們合作,通過我們的圖形IP來實現這一點。如你所知,AMD不是智能手機企業,因此合資企業將產生三星隨後將部署到他們產品中的技術。

問:從我們的聽眾來看,我需要向你提出的一個最常見的問題是關於臺積電的產能。你能解釋一下這會如何影響AMD嗎?

佩珀馬斯特:臺積電是我們的關鍵合作伙伴,他們和我們大家一起參加了第二代EPYC的發佈。我認為這確實幫助人們瞭解了臺積電的規模。臺積電歷史上推出最快的是它的7nm工藝節點,遠遠領先於我們推出Rome和EPYC。因此,我們與臺積電建立了很好的合作伙伴關係,並獲得了大量的供應。當我們第一次推出表現最好的Ryzens時,我們確實出現了芯片供應短缺的問題,但這僅僅是因為需求超出了我們的預期和我們的計劃。這根本不是臺積電的問題。

問:我們有看到臺積電延長訂單交貨期的報道嗎?這是否會為2020/2021年的發佈做好準備?

佩珀馬斯特:我們與臺積電的密切關係讓我們對他們能夠提供什麼以及何時提供有一定的洞察力。但我們也必須利用我們的規劃團隊,他們必須在每一款產品和每一次發佈時都保持全力以赴。正如你所知道的,這永遠是一種方式:不僅是流行節點的交付期,而且領先邊緣節點的交付期也是每一代都在增加。因此,不僅是AMD,任何一個人都必須在這方面慢慢的變好。

AMD的市場佔有率

問:有些媒體和分析師始終在關注AMD在產品性能和企業戰略方面的動作。他們一直在等待AMD迎頭趕上,並提供健康的競爭,它現在正在這樣做,現在我們正在關注你們的競爭對手何時會趕上你。儘管如此,我們仍然認為AMD的企業市場佔有率增長可能比預期的要慢。這是有原因的嗎?或者,我們是否仍在向人們灌輸AMD已經恢復運營,抑或是緩慢的企業更新週期的犧牲品?你能澄清下嗎?

佩珀馬斯特:如果你看看服務器市場,我們說過,我們預計在2020年中期左右,我們的市場佔有率將達到兩位數。人們問我們為什麼需要這麼長時間,為什麼我們沒有更快地行動,而事實是,在數據中心市場,需要更長的時間來吸引合作伙伴並完成他們的整個認證週期,以優化他們的客戶工作案例和應用。事實上,我們對原始設備製造商和客戶的反應非常滿意,對我們的第二代EPYC,對Rome,我們正走在我們的預期軌道上,市場也在增長。

問:AMD目前市場上處理器最高的TDP(熱設計功耗)是280W,例如為HPC設計的EPYC 7H12。TDP擴張有上限嗎?我們預計英特爾將推出更高的TDP芯片,TDP在350W到400W。

佩珀馬斯特:與我們的OEM合作伙伴的合作不單單是最大化CPU可用的功率。你還可以跨CPU和GPU工作,這就是我們為Frontier超級計算機使用Cray/HPE所做的事情。這確實表明,我們大家可以與OEM合作伙伴在硬件、系統和軟件堆棧之間進行系統優化,以真正推動HPC市場的發展。

7H12是我們繼續推出Rome的一部分,你能夠正常的看到ATOS使用它,我們真的很高興他們看到自己的位置趕上了TOP500榜單,因為這是一場與時間的賽跑,但這只是展示了你可以用出色的執行力做些什麼。但是,當你想到集成水冷解決方案的時候,它告訴你,你必須發展這些密切的合作伙伴關係,就像在AMD與我們的OEM客戶所做的那樣,而且未來能夠得到更多的性能。


分享到:


相關文章: