iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技

這篇文章不準備聊具體的性能,具體的性能請等實測,這裡只准備聊一下隱藏在Apple A13 Bionic之下的那些暴力美學。A13在核心性能上和其他眾多SoC完全不是一個級別的,一個天上一個地下。 雖然受限於軟件(特別是跑分軟件)的落伍,A13諸多特性不能發揮完全,但是這並不影響A13就是牛牛牛。

Apple可能是篤定消費者看不懂這些東西,所以並沒有很多宣傳,但這些東西如果拿過來給國產安卓廠商宣傳,肯定能吹開花。 畢竟當年Kirin 970 搭載的應用場景及其受限的NPU,都有一眾人認為NPU最重要,NPU加速一切等。

計算

首先我們聊聊計算部分,隨著AI的高速發展,NPU已經成了一個旗艦SoC不可或缺的單元了。但從性能上說,Apple今年NPU上的改進不大,官方PPT顯示大約提升了20%的運算力,按照華為自己的PPT裡A12的成績,提升20%後在華為PPT的項目裡面依舊落後於華為麒麟990。但是我依舊不會說A13的NPU被華為吊打,一方面這個華為給的並不是標準的Benchmark,而是部分特定項目的成績,實際綜合水平真的難說。不同的網絡架構、精度都會有顯著的區別,無法透過單個成績判斷。你看高通855就有嚴重的偏科現象,具體的水平只能等大規模的評測出來。 當然我也沒說A13的NPU實際算力會超過990,我直覺上應該至多差不多,或者差的沒那麼多。華為的PPT,說他專門挑自己的優勢項目出來不過分吧?


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


對於NPU,最重要的是什麼? 是能夠發揮多少。 單純比較NPU算力或者是比較特定模型都是沒有意義的,因為NPU一般都面臨著空有算力但是難發揮不出來的問題,最後要看實際網絡發揮多少,各種因素都可能出現。不同網絡、不同精度、都會得到不同的結果。對於手機,比較NPU發揮了多少效力,比算力重要。像華為這個PPT,我們可以得到的是華為的解決方案,在類似圖像分類上表現應該非常優秀,但是換到其他領域 即便是圖片 如果網絡結構差異大 精度差異大 這兩項成績都不能拿去換算。

另外就是NPU並不是通用計算,不是隨便寫一個程序就能發揮出來性能的,也不是隨便一個應用都能從NPU中收益的。NPU應用非常考驗軟件優化,一個手機能有多少任務能夠從NPU中收益才是最重要。 在手機上,能夠應用NPU加速的場景越多,越有價值。

在轉件上,蘋果有天然的優勢。 一方面iPhone的操作系統從底層到應用層,都完全由蘋果控制,在系統層面利用NPU加速特定任務可操作性比安卓大很多。另外,iPhone的機型數目很少,硬件差異小,第三方利用NPU進行開發代價也很小。 安卓的機子高高低低,具體參加運算的單元五花八門,CPU DSP GPU NPU都有可能,而且不同廠之間的硬件差異也頗大,優化起來真不是一個難度。


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


NPU不是特別通用的計算單元,並且和CPU距離較遠,為此蘋果A13 Bionic 還有一個集成在CPU中非常暴力的計算單元,A13的大核心上應該多加入了類似Intel AVX的單元(AMX單元),獲得了6倍於前代的矩陣加速性能,看起來是大於等於1TFlops的單元。 這類SIMD操作靈活性比NPU大很多,並且不需要太多的通訊開銷。

根據歷史資料,A12 有三個128bit FMA (共計 384bit FMA)的單元,結合Apple宣傳的提升指標,我猜測A13 變成等效 512bit的SIMD寬度,然後支持類似AVX512的低精度向量化(從32bit到8bit)操作,並結合頻率提升,最後差不多就是6倍。這樣總計下來峰值性能是:2.66*2*512/8*2*2=1.36T, 而實際上大家做SIMD FMA都會有降頻,所以大體算下1T是符合標準的,這個寬度正好對應上去。


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技




iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技




iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


在CPU內部堆大量SIMD類似單元的,只有實力超群者才有能力去做,AMD的第一代Zen等效只有256bit FMA,Skylake/Icelake和第二代Zen2 有 512bit FMA,而Skylake-X則有1024bit的FMA。 另外只有Icelake和Skylake-X支持AVX512(具體子集有區別,AVX512請看這裡 傳送門),我很早就說AVX512的價值不僅僅是提升寬度,而在於極大的拓寬了使用場景。 從我目前的估算來看,A13的CPU SIMD規模和先進程度基本是和Icelake近似的,Skylake和Zen2雖然寬度一樣,都不支持低精度的加速。 況且,A13只是一個手機平板用的處理器啊,能達到這個規模相當不容易,大家看看AMD口口聲聲說要發力服務器,至今SIMD能力都被蘋果吊打著。

給大家一個參考Icelake AVX512的參考:


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


你以為這就完了? 其實還不是,雖然不知道A13的AMX單元適用性有多廣,但是你看四核心 Icelake也是1T級別的性能,Apple A13 AMX也是1T級別的性能,暴力不暴力?


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


給這部分內容做個總結,雖然現在A14的具體評測沒有出來,我這裡也不準備評價A13的IPC提升如何,但是之前A12的IPC已經是Skylake甚至Skylake之上的水平了,而此時A14在SIMD上也追Intel 消費級AVX512差不多的水平了,A13真的只能說太牛X了。 AMX很可能並不是為手機準備的,甚至不是iPad,AMX的價值在於運算負載更高的場景,Apple極大概率是在為自己的A系列Mac做準備。 就目前的水平來看,A13這個架構拿去做Mac是完全足夠的,只差頻率打磨和軟件生態的改進了。而在手機上,這個AMX功耗多高不要緊,因為手機並不不是計算密集的設備,而且即便特定任務真用到了很多AMX,降頻就可以,超寬的SIMD降頻也會大幅度的高於窄SIMD高頻。


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


對於AMX最大的問題就是編譯問題,不太清楚AMX是用ARM的類似SVE的向量指令集還是什麼特定指令集實現的,如果一個第三方應用在不調用API的情況下,要利用這個指令集加速,編譯上應該需要做一些改進。 如果直接用現成的Core ML包,就不用考慮那麼多了。從這個角度上看,跑分軟件要適配AMX可能還要段時間,可能一直不會支持。

ISP

今年新iPhone有沒有增大CMOS不知道,蘋果一如既往的在CMOS上摳門,但是在計算攝影上下血本,A13 Bionic 的ISP性能非常暴力。結合iPhone的軟硬件優化實力,實際發揮出來的ISP性能應該是一眾ISP裡最高的:

1、A13 Bionic似乎是有且唯一一個能夠同時開啟三個攝像頭(拍照時)的芯片吧?我記得高通和麒麟的芯片似乎都是隻能開啟兩個。另外iPhone 錄像時也可以開啟四個攝像頭。

2、iPhone實際上是有超過4K 120FPS以上的處理能力(且實際發揮了),這代iPhone開啟改進的Smart HDR拍攝視頻依舊維持到了4K 60FPS的水準。 4K 60FPS HDR視頻首先要和平時4K 120FPS有一樣的吞吐,此外還要進行HDR合成 進一步增加ISP的要求。

3、在維持超高的幀率下,蘋果視頻的拍攝質量依舊是業界領先(背後也還是ISP算力的體現)。

綜上,A13 Bionic這顆SoC的ISP不可謂不暴力。


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


三星的Exynos 9825,在硬件理論上也有4K 150FPS的處理能力,大於A13的120FPS,但這個對比相當不公平,因為蘋果公開的並不是ISP性能,前文說Smart HDR/多開攝像頭/算法等會消耗相應的ISP算力,如果讓Exynos 9825 實現畫質近似,難度近似的視頻拍攝,幀率能到多少真不好說。作為對比,沒有類似Smart HDR的Galaxy Note 10+ 9825版和855版 視頻拍攝都是最高4K 60FPS。實際表現性能被甩開1倍多(再怎麼說蘋果的視頻質量不差於三星吧)。


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技

9825版 Note 10+視頻能力

高通855,我沒有找到其視頻拍攝的具體指標是多少,按照之前Galaxy Note 10+和其他安卓旗艦的水平,實際輸出是4K 60FPS。 高通官網給的是 720P 480FPS 換算後等於1080P 240FPS 和 4K 60 FPS,符合估計。


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


華為這邊,上一代麒麟 980在P30 Pro上最高只可以體現出4K 30FPS的能力,實際能力未知。 最新的麒麟 990 在ISP上只提升了 15%,這麼看來 4K 60FPS可能是其上限,並且基本不太可能在4K 60FPS上帶有更多複雜的特性。


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


iPhone 11 系列有多牛:A13背後的瘋狂堆料與黑科技


小總結,Apple在ISP實際性能上也是領先其他SoC上領先安卓SoC很多,雖然紙面性能上三星堪比蘋果,但是實際完全沒有體現,也就沒法說。

總結

大家覺得蘋果很奇怪嗎?一方面在很多細節部件上一直很摳門,充電/邊框/鏡頭規格等上都是非常落後的,一直試圖靠算法/CPU等去補齊,而且還不太宣傳? 這是不是和Intel很相似?

因為這是在玩王者擠牙膏的遊戲,充電/邊框/Sensor大小這些東西又沒什麼難度,蘋果故意擠牙膏罷了,而CPU架構/算法這些可不是簡單從供應商花錢買一下就能做到的。 Apple要擠牙膏啊,萬一哪天蘋果銷量下降,或者遭遇什麼技術難題,就可以通過這些簡單的東西完成產品升級。就像Intel的Skylake,Intel之前就是不肯靠堆核心來提升性能,而是在探索IPC和頻率,因為堆核心比起IPC和頻率簡單太多了。當Intel 10nm出問題,Intel再慢慢的拿出來就可以實現性能提升。 這從消費者角度上看很惡龍,但是對於廠商很必要。有技術壁壘的地方,蘋果Intel一點不擠牙膏,而簡單的東西則一直藏著掖著。

同理還有索尼的相機,索尼現在不也不肯做簡單的無損Raw,不肯用好的LCD等,知道為什麼了吧?不是不會做,而是故意不做。 這些簡單卻有誠意的東西,只有弱勢的廠會去做,稍微大一點的廠能擠牙膏就要擠牙膏。


請多多關注


分享到:


相關文章: