再次成爲世界的焦點,看華爲如何實力「碾壓」高通與蘋果?

華為消費者業務CEO餘承東在2018德國柏林消費電子展(IFA)上發表“The Ultimate Power of Mobile AI”的主題演講,面向全球推出華為最新一代卓越人工智能手機芯片—麒麟980。

似乎已經好久沒有收聽到國內有哪些重大事件發生了,然而在8月的最後一天,華為似乎帶著不可辜負的使命,讓天朝再次成為世界的焦點!

8月31日晚八點,華為在德國IFA 2018展會上正式揭曉了新一代移動SoC處理器“麒麟980”。

一向自信的餘承東直言:“基於多項技術突破和方案創新,麒麟980不僅在性能、能效、移動通信連接等方面領先業界,同時增強了AI運算力及豐富了AI應用場景,將再次引領手機全面進入智慧時代。”

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

不弔任何胃口,餘承東直接公佈了麒麟980的六個世界第一。

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

翻譯成中文就是:

全球最早商用的臺積電7nm工藝的手機SoC芯片 -

全球首次實現基於ARM Cortex-A76開發的商用CPU架構,最高主頻可達2.6GHz -

全球首款搭載雙核NPU -

全球最新採用Mali-G76 GPU -

全球最先支持LTE Cat.21,峰值下載速率1.4Gbps,達到業內最高 -

支持全球最快LPDDR4X顆粒,主頻最高可達2133MHz,同樣業內最高 -

世界第一個7nm製程工藝SoC。

整個芯片尺寸僅為14mm*14mm,相比業界普遍採用的10nm製造工藝,性能可提升20%,能效提升40%,晶體管密度提升到1.6倍,實現性能與能效的雙重提升。由臺積電代工。

世界第一個ARM A76架構CPU

首次實現了基於Cortex-A76的開發商用,在指甲蓋大小的尺寸上塞進69億個晶體管,與上一代相比單核性能提升75%,能效提升58%。

此外,Kirin CPU子系統推出了Flex-Scheduling智能調度機制,創造性地設計了2超大核(基於Cortex-A76開發)、2大核(基於Cortex-A76開發)、4小核(Cortex-A55)的三檔能效架構,提供了更為精準的調度層次,讓CPU在重載、中載、輕載場景下靈活適配,讓用戶獲得更高性能體驗的同時獲取更長的續航體驗。

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

世界第一個雙NPU

在雙NPU的移動端算力加持下,麒麟980能做到人臉識別、物體識別、物體檢測、圖像分割、智能翻譯等AI場景,採用更高精度的深度網絡具備更佳的實時性,從而獲得更優體驗。麒麟980實現每分鐘圖像識別4500張,識別速度相比上一代提升120%。

全新一代的 NPU 設計,在 AI 性能上遠超過現有其他強調 AI 的競爭產品。

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

世界第一個商用Mali-G76 GPU

與上一代相比性能提升46%,能效提升178%。麒麟980引入了AI調頻調度技術,能夠實時學習幀率、流暢度和觸屏輸入變化,預測手機任務負載,動態智能感知手機使用過程中存在的性能瓶頸,及時進行調頻調度。

在遊戲場景下,使用AI調頻調度技術預測遊戲每幀負載,預測準確性可以提升30%以上,有效提升了遊戲平均幀率,大幅降低遊戲抖動率,減少遊戲卡頓,為手遊用戶帶來操作流暢、不卡頓的優秀遊戲體驗。

世界第一個1.4Gbps Cat.21基帶

在網絡支持方面,麒麟980支持LTE Cat.21,支持業界最高的下行1.4Gbps速率。此外,麒麟980配套使用手機WiFi芯片Hi1103,率先支持160M帶寬,理論峰值下載速率可達1.7Gbps,是業界同期水平的1.7倍,同時,Hi1103支持業界領先的L1+L5雙頻GPS精準定位,L5頻段下定位精度提升10倍,有效改善手機定位精準度。

世界第一個支持LPDDR4X-2133內存

麒麟980採用的是2大核+2中核+4小核設計,配合2133MHz內存,帶寬提升了20%、延遲降低了22%。

另外,在拍照能力上,麒麟980採用第四代自研ISP,像素吞吐率比上一代提升46%,能夠分區域調節圖像色彩與灰階,支持更多攝像頭,全新HDR色彩還原,能夠分區域調節圖像色彩,實現照片色彩與細節的平衡。

在演講的最後,餘承東宣佈了HUAWEI Mate 20系列將於10月發佈。作為首個搭載麒麟980芯片的智慧手機。

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

從麒麟 970 到麒麟 980,最新架構的引進大幅改進能效表現

麒麟 970 這款在 2017 下半年推出的芯片對華為而言極具有戰略意義,其推動的華為產品佈局與 AI 應用生態,奪走了許多消費者的眼光,也順勢推動華為的許多產品的銷售。

然而,從麒麟 970 的設計理念中,還是能看出華為為了節省成本而做的努力。首先,其 CPU 架構採用 4 個Cortex-A73 搭配 4 個 Cortex-A53,是當時的主流高端架構,但是在 GPU 方面,卻只採用了 12 核心的Mali G72,並通過提升運行頻率以強化其性能表現。這種作法相當簡單粗暴,但是對於降低芯片面積以及 IP 授權成本有一定的效果,只不過還是有些副作用出現,首先,由於頻率較高,將直接挑戰架構和工藝本身的功耗牆,一旦超過邊界極限,那麼功耗和溫度就會直線上升,影響持續性能輸出表現和穩定性,手機也會明顯發熱。

為了控制成本,麒麟芯片通常會使用少核心高頻的手段來取得成本和效能的平衡,但功耗效能上的表現多少都會受到影響。為了解決這個問題,華為利用軟件優化手段,也就是 GPU-Turbo 手法,針對性的瞄準特定遊戲應用來優化其功耗與性能表現,的確發揮了不錯的效果,就連高通也希望仿效這種作法來改善其硬件的表現,對業界整體而言,華為的確帶起了一波技術革新與示範作用。

而麒麟 970 的另一個重點在於全球首發的 AI 硬件 NPU 設計,其AI算力很強,可以在 1W 功耗下達到4TOPS 的性能表現,不止相關應用的性能與效果超出高通的異構計算,甚至蘋果 NPU 也自嘆不如,而其他的“純軟件模擬 AI 方案”就更不用說了。

而此次在 IFA 大會上發佈的麒麟980,採用的是 Cortex-A76。Cortex-A76 是在今年 6 月才發佈,官標的數據方面,基於臺積電 7nm 工藝的 3GHz A76 核心比 10nm 2.8GHz 的 A75 核心性能提升 35%、省電40%、機器學習的負載能力提升 4 倍。

在 GeekBench 4 跑分方面,整數和浮點相較於 A73 提升了 90% 和 150%,最終得分提升 35%。

A76 同樣支持 DynamIQ 拓撲特性,官方建議 1+7/2+6 這樣的 Big.little 大小核設計。通過使用最新核心,麒麟 980 的性能表現也達到驚人的程度,另外在 GPU 部分,同樣也採用了最新的 Mali-G76,其性能密度提升了 30%,節電 30%,用於手機的圖形性能會提高 50%,現在可以支持最高 8K 分辨率的屏幕了。不過由於成本考慮,雖然核心數量只有 10 個,較麒麟 970 少了 2 個,但性能是相當於 20 箇舊版核心。

但值得注意的是,由於必須考慮到成本架構,華為在麒麟 980 的架構設計上依然還是偏重成本控制,所以除了使用最新架構外,核心數量或者是自定核心並沒有太過積極的動作,因此,在同業對手的方案相繼跟上 7nm 腳步後,華為要面對的競爭態勢也將會有所改變。

不過在重點的 AI 單元,華為將繼續使用專用 NPU 的方案,並使用了雙核配置,性能達前代方案的 135%。而且其設計原生為 7nm 工藝優化,更能適合麒麟 980 的設計方向,而這點也將成為麒麟 980 能否領導未來手機 AI 方案的重要關鍵。

其他 AI 手機方案競爭者

即將引入硬件 NPU 的高通

作為全球最大的手機方案供應商,高通過去通過 Hexagon 與 GPU、CPU 協同工作,達成對主流AI 框架的計算加速能力,雖然在效率上還是明顯落後蘋果與華為的硬件方案,但總是給市場一個交代。

然而,異構計算(Heterogeneous computing)雖然彈性高,且可以有效利用芯片中的不同類型計算架構,但目前 AI 計算方案講求的是更高的能效表現,而在手機等移動終端上,更顯重要,雖然高通的異構計算已經屬於相當高效的技術,但仍與 ASIC 有一定的落差,也因此,在使用針對 AI 加速框架進行性能的評比應用時,高通很明顯要落後採用硬件 NPU 的競爭對手,未來如果 AI 模型往更復雜的方向發展,或者是同時需要執行多種 AI 服務,那麼在發展空間上就可能會明顯不如競爭對手了。

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

不過,高通也不是不知應變,根據市場傳聞,其在下一代中高端方案驍龍 700 系列中,將引入硬件 NPU 設計,而如果成真,其下一代高端方案,也就是驍龍 855,也將可能沿用同樣的方式。

而目前高通也引進了包含商湯等多家 AI 算法設計公司所設計出來的應用框架,想要快速衝刺相關市場,不過高通目前的 AI 性能還有相當大的改善空間,如果要負載更復雜、多元的 AI 計算,恐怕還是要等到下一世代的 AI 設計問世。而根據 DT 君得到的信息,高通將在 12 月正式發佈新一代的高端 AI 手機方案,按照往例,明年初就可以見到實際終端產品。

三星從抄襲到走出自己的路,Exynos的半軟半硬 AI 亦然

三星作為全球最大的手機廠商,其勢力涵蓋終端、消費、雲端服務、半導體制造與設計等領域,而其中,手機市場是其最重視的一塊,而為了推動其手機市場的佈局,三星過去亦步亦趨的追隨包含蘋果與高通的步伐,並將學習到的設計精髓轉化為自有的方案設計。

目前三星主要的芯片來源包含了自行設計的 Exynos 系列、高通的驍龍系列、聯發科的低端 MT 系列,以及展訊的 SC 系列,市場從最高端,到最低等級,可能會被我們直接當作電子垃圾的產品,幾乎都有覆蓋。

目前 Exynos 9810 是三星的主力自產高端產品,今年的 Galaxy S9 系列、Note9 系列都可見到其身影,其採用的 AI 計算方式與高通類似,主要是通過 DSP、GPU 與 CPU 的協同計算,不過三星有個特殊的作法,那就是視覺相關的處理交由硬件,而非異構計算。

目前的 9810 採用脫胎自 Cortex-A75 的 M3 定製架構,並搭配 Cortex-A55 作為小核心,而與華為最大的不同是,三星在 GPU 規模上相當捨得下工本,其 Mali-G72 核心數量配置高達 18 個,比麒麟 970 多出 6 個,雖然芯片成本會較高,但可以在較低的時鐘水頻達到更穩定、更好的效能表現,換言之,能效也更好。

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

而 9810 中有個 VPU 計算單元,顧名思義,是用來處理視覺方面的計算工作,這個單元應該是硬件設計,但只能用來處理比較固定的功能,三星也未公開發布任何支持該計算單元的可編程或開發套件框架。

而其他的 AI 計算工作就如高通般,是使用異構計算,統 GPU 與 CPU 來達成,這方面可能主要是沿用 Arm 的軟件資源,三星也同樣沒有發佈任何相關的開發套件給第三方開發者。

而下一代方案,也就是 Exynos 9820,將會採用 ARM DynamIQ 架構設計,並且將以“2+2+4”三叢集形式打造,其中兩組大核將採用三星第四代自主架構“M4”,第二道兩組大核則以 ARM Cortex-A75 構成 (也可能以 Cortex-A76 取代),而小核部分則將以 4 組 ARM Cortex-A55 構成。

AI 部分則將可能維持 9810 的作法,那就是採用 VPU 硬件處理單元來處理部分視覺計算工作,並搭配既有的異構計算方式來處理標準 AI 計算框架,也就是半軟半硬的方式。

最後,9810 採用的是三星 10nm工藝,而 9820 將可能是三星 7nm 方案首發,但因為三星的 7nm 採用 EUV 技術,目前還在調試中,真正量產最快也要今年底或明年初,這也可能讓 9820 成為最晚推出的次世代 AI 手機芯片方案。

賺走最多錢的手機公司搞 AI——蘋果

蘋果基本的手機芯片佈局是每年一款,當然,為了配合如平板電腦或者是手錶等其他終端的產品時程,也會在不特定的時間點發布相關方案。而蘋果最新的手機芯片是去年發表的 A11 Bionic,內建的硬件 NPU 是最大特色。而蘋果在其芯片中往往都使用較少的核心,相較對手都已經走到 8 核以上,蘋果 A11 還只是個 6核產品,但其表現出來的性能數據卻遠遠超越所有競爭對手,其原因包括蘋果對其使用的 Arm 架構深度定製化,並捨得為了特定性能目的來堆加更多晶體管,因此其芯片製造成本往往也都比同時期的手機芯片方案更高。但此策略成功推動手機的銷售,並創造更高的獲利,因此每一代方案蘋果也就更捨得堆料,形成正向發展。

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

A11 使用的是臺積電 10nm 工藝,這也是少數幾次沒有使用到三星代工工藝的蘋果芯片,由於目前蘋果的開發套件中,只開放 GPU 計算能力給開發者,而 GPU 也負擔包括第三方 AI 應用的訓練或推理的工作,對蘋果而言,GPU 的份量也越來越重要,這也是之所以蘋果要推動自有 GPU 架構的發展。

雖然目前所採用的 PowerVR 架構在性能與菜單現上相當出色,該公司也願意配合蘋果進行高度定製工作,但這對於蘋果而言仍遠遠不足,而展望未來蘋果對其 GPU 架構的佈局,將可能是個結合繪圖、計算以及推理、訓練的全功能 AI 優化設計,當然,為了能耗表現,推理工作可能還是維持獨立的 NPU 單元來進行。

而未來 A12 將會如何?其實在現階段也只能猜測,唯一能確定的只有使用 7nm 製造工藝這點。而在架構方面,根據過去的慣例,性能的增長肯定是不能忽略的,畢竟對手也都在積極追趕,今年對手的主流方案都已經在整體性能上有相當大的改善,也拉近了與 A11 的距離,A12 肯定會在CPU 與 GPU 方面進行更深度的改造,不論是增加更多的處理管線,更優化 CPU 或 GPU 內部的流水線設計,亦或者粗暴的堆加核心,都是可能的作法。

至於在關鍵的 AI 硬件單元方面,除了強化效率以外,也可能就規模方面進行擴展,藉以壓制華為或高通等即將面世的下一代 AI 方案。

專注中低端的聯發科

聯發科 2018 年主打的 AI 手機方案 P60,具備 AI 專用計算模塊的APU(AI specialized Processing Unit),基於 DSP 計算架構,而 CPU 則是採用Cortex-A73 搭配 Cortex-A53 的四大四小設計,雖然不是採用最新的 Cortex-A76,但性能表現仍有一定水準,GPU 方案則是使用 Mali-G72 這款相當穩定的 GPU 架構,不過可惜的是,聯發科為了成本考慮,只採用 MP3 配置,並以高頻率運作來補足性能表現,因此在運行遊戲時,可能會對電池壽命產生負面影響。目前 P60 已經被應用在包含 OPPO 等多款手機產品當中,雖後的小改版產品也已經箭在弦上。

再次成為世界的焦點,看華為如何實力“碾壓”高通與蘋果?

目前,中國前幾大手機廠商都是聯發科的客戶,產品多分佈在中低端,包含華為、OPPO、VIVO、小米、魅族,以及其他二三線廠商,基本上都擺脫不了聯發科,畢竟中低端手機中具備成本優勢,產品線完整且技術更新還能跟上市場腳步,且能提供最好技術支持服務的,就屬聯發科了。而在前兩年,聯發科也打入三星的供應煉,通過使用一定比重的三星芯片代工工藝服務,三星也在其低端手機中採用聯發科的方案作為交換。

聯發科的方案成本相對較低,且過去在包裹 TurnKey 服務方面口碑極好,在中國的支持人力也最廣泛,雖然是 AI 生態的後進者,但是在商湯等 AI 大公司的協助之下,或許第一時間就能夠提出夠成熟的語音與視覺 AI 方案,對客戶而言,聯發科一直都是便宜又大碗的選擇。

對於HUAWEI Mate 20系列將會搭載980芯片你怎麼看?又講會給廣大用戶帶來怎樣的性能體驗呢?


分享到:


相關文章: