龍芯處理器性能怎麼樣?

小超帥哥


關於龍芯3A3000的性能,在龍芯3A3000發佈的時候,官方提供了一份SPEC2006成績。1.5GHz下,使用老舊的GCC4.7.7編譯器,老舊的3.10.84內核,所得分數為單核整數性能11.1,單核浮點性能10.1。

後來有網友在相同條件下測試,和官方提供的數據一致。

注:SPEC CPU性能測試與編譯器優化和編譯優化參數息息相關,優化級別越高響應的跑分越高。如果用Intel的ICC編譯器編譯SPEC CPU測試程序,得分遠高於微軟的Visual C++和GCC。即使同樣用GCC編譯器相同的優化參數,不同的GCC版本的分數也不同,一般GCC版本越高得分越高。

其實龍芯3A3000的SPEC CPU 2006的性能測試,已被寫入本科教材《計算機體系結構基礎(第二版)》。這本教材的計算機體系結構講是龍芯平臺的體系結構,感興趣可以購買查看。

不得不承認,龍芯2E(2006年)是龍芯和Intel性能最接近的時候,那個時候龍芯和Intel只有兩年的差距。但是後來,龍芯錯誤地走上了多核線路而忽略了單核性能,Intel則推出了酷睿處理器,龍芯和Intel的性能差距拉大了。到今天,龍芯3A3000(1.5GHz)只能和Intel的賽揚J1900(2.0GHz)比。好在Intel和AMD的CPU性能都達到了“天花板”,單核性能很難提升,都開始走多核線路。對龍芯來說這是個趕上的機會。好在現在龍芯CPU的性能可以每代翻倍穩步提升,龍芯的未來還是有很大希望的。

然而龍芯3A3000能做到“能用”的水平。要想“好用”,還得等下一代產品。


芯故事


在高性能處理器領域,英特爾是天花頂一般的存在(先不算地位特殊的IBM公司),國內發展CPU處理器的公司很多,絕大多數實力跟英特爾相比都差很遠,但是大家都非常想看到國內這些小公司跟英特爾比拼處理器性能。在國產CPU領域,龍芯是起步較早的公司之一,不過龍芯處理器走的是MIPS指令集體系,目前已經發展出了多款龍芯處理器,其中針對桌面市場的最新產品是龍芯3A3000,它的性能到底如何呢?有龍芯愛好者做了實際性能測試,測試下來單核性能相當於intel i5-7200U的30%~40%,不過下一代龍芯3A4000處理器同頻性能將從i5-7200U的60%~70%提升到80%~90%,不過總體差距還是非常大的,龍芯要走的路還很長。

有關龍芯處理器的測試這幾年來零零散散在網上出現過多次,前不久有龍芯愛好者在龍芯社區發表過龍芯3A處理器的全面性能測試,只是這篇文章的圖片掛了,他最近在知乎上也發了一次,發表在龍芯往事專欄中,知乎ID是第一千零一人。

這套平臺是去年9月份龍芯俱樂部的龍芯3A主板團購時買的,由作者自行搭建好一套平臺,使用phronix-test-suite對龍芯 3A3000 處理器做了一個儘可能理性、中立、客觀、全面的評測,不吹不黑,不誇大成績也不迴避問題。

這裡節選龍芯3A3000處理器的測試及總結部分,首先來看看龍芯3A3000平臺的樣子。

龍芯 3A3000 主板照片,風扇下面是龍芯的 CPU。另外兩塊散熱片下面分別是南橋和北橋。

拆下風扇後,龍芯 3A3000 CPU 的近照, 其中的 LS3A3000D-LP 意思是說這是一個低功耗版本的龍芯 3A3000CPU。

開機後 BIOS 中的信息,可以看到 CPU 的主頻是 1400MHZ,一級指令緩存 64KB,一級數據緩存 64KB,二級緩存 4MB。

主板上的國產 Unilc(西安紫光國芯半導體)內存條。

補充一下龍芯官方的龍芯3A3000處理器的架構及規格

上圖是龍芯3A3000的主要規格,頻率最高1.5GHz,不過原文作者拿到的這塊龍芯3A3000處理器不是性能最高的1.5GHz主頻版本,而是性能略低的1.4GHz 版本。因此,在估算龍芯3A3000(1.5GHz)的性能時,應該將我的測試結果乘以1.07。此外,需要說明的是龍芯3A3000筆記本里帶的龍芯3A3000的主頻被限制在了1.2GHZ。

規格對比

性能測試基本環境

龍芯3A3000處理器性能測試

測試是在Linux系統上進行的,很多測試內容都偏重CPU理論性能測試,跟大家熟悉的Windows下CPU性能測試不同,原作者對每個測試項目有詳細的解釋,感興趣的可以仔細看下,這裡就不對測試性能一一介紹了,覺得長的直接看最後的結論。

對比的CPU除了英特爾酷睿i5-7200U、賽揚J1900之外還加入了國內另外的處理器FT-1500A、FT-2000+的。

作者的結論:

從縱向上看龍芯的發展,相比龍芯 2F,龍芯 3A3000 的性能有了很大的進步。工藝上,從龍芯 2F 的 90nm,提高到了龍芯 3A3000 處理器的 28nm;主頻從龍芯 2F 的 800MHZ 提高到了 1.5GHz。在用戶實際應用上,基本可以達到流暢使用的程度。與 Intel 處理器相比,龍芯 3A3000 綜合性能相當於 Intel J1900 處理器,單核性能相當於 intel i5-7200U 的 30%~40%。通過本文中所進行的 34 項測試,我們發現龍芯 3A3000 在性能不好的根源有以下幾個:同主頻性能較弱

從同主頻性能來看,龍芯 3A3000 已經超過了 J1900, 但只有 intel i5-7200U 的 60%~70%。預計 2019 年流片的龍芯 3A4000 同主頻性能至少有 30%的性能提升。主頻太低

這是龍芯處理器讓眾多愛好者耿耿於懷的的一個難以迴避的弱點。誠然,主頻不代表所有性能,但主頻太低是萬萬不行的。J1900 的同主頻性能弱於龍芯 3A3000,但由於它的主頻可以到 1.99GHz,並且還可以睿頻到 2.4GHz,在多項測試中一樣超過了龍芯 3A3000。Intel i5-7200U 基礎主頻達到 2.5GHz,睿頻可以到 3.1GHz。飛騰 2000+主頻可以到 2.2GHz,而兆芯的 KX-6000 主頻甚至可以到3.0GHz。飛騰、兆芯處理器可能在同主頻性能上弱於龍芯,但還是可以靠著較高的主頻擊敗龍芯 3A3000。龍芯主頻較低的原因之一是落後的工藝製程,目前還在使用 28nm 工藝,而Intel、飛騰、兆芯等已經在使用 14nm 工藝。根據龍芯的發展規劃,到 2020 年龍芯將使用 14nm 工藝對了龍芯 3C5000 進行流片,主頻能夠達到 2.5GHz。

系統軟件優化不夠

在測試中,我們發現的問題有三角函數等數學函數運算速度過慢,看起來部分硬件浮點運算的沒有得到應用,而且龍芯缺少一個優化的 數學函數庫。在加密解密指令上,缺少AES 硬件實現。在測試中,我們發現使用Debian 操作系統、GCC 7.3 和 1.4GHz 的龍芯 3A3000 進行的各項測試基本優於使用 Loongnix 操作系統、GCC 4.9 編譯器和 1.5GHz 龍芯 3A3000 的組合。我們認為編譯器的優化對發揮龍芯的性能非常重要。在測試中,我們也發現使用 4.14 的 Linux 內核會比3.10 的 Linux 內核上有相當程度的性能提升,龍芯依然缺少優化的 Linux 內核。應用軟件優化不夠

由於 MIPS 架構缺少軟件生態,各種應用軟件缺少針對MIPS 架構的優化。具體表現就是在很多軟件有針對 X86 系統的彙編優化。要建立龍芯的生態,發揮龍芯處理器的性能,相同級別的優化不可缺少。隨著龍芯未來架構的優化、主頻的提升,影響龍芯發展的瓶頸將不是處理器的性能,而是軟件生態的建設,也就是系統軟件優化以及應用軟件優化。其中,各種應用軟件的優化將是提升龍芯用戶體驗的捷徑。實際上,龍芯也已經意識到了這些問題,提出了要學習蘋果,”app by app, feature by feature, pixel by pixel” 的進行優化。

龍芯下一代處理器龍芯3A4000的展望

原作者對龍芯3A3000處理器的評價確實做到了不吹不黑,龍芯3A3000處理器有進步有優點,不過不足之處也非常多,除了架構方面的原因之外,落後的製造工藝也限制了龍芯3A處理器的性能,這些問題想解決也不是一蹴而就的,好在龍芯3A3000已經是問世幾年的產品了,下一代龍芯3A4000處理器也箭在弦上,預計2019年初問世,第一千零一人也對此作了性能預測:

當下,龍芯 3A4000 的流片工作正在開展,預計到 2019 年初就能看到芯片了。在3A4000出現之前,我們對 3A4000 的性能進行一下預測。基於我們的評測,我們認為,3A4000的同主頻性能將從 i5-7200U 的 60%~70%,提升到 80%~90%,2.0GHz 下單核性能達到 i5-7200U 的 2/3,多線程性能超過 i5-7200U。和國內其他 CPU 相比,龍芯 3A4000 的同主頻性能將超過飛騰以及兆芯,單核性能也將超過飛騰 2000+,但由於 3A4000 落後的28 nm工藝、依舊較低的主頻(2.0 GHz),龍芯3A4000 的綜合性能將可能依舊無法超過採用 14 nm 工藝,主頻 3.0GHz 的兆芯 KX-6000。但鑑於KX-6000 並沒有看大規模量產出貨的跡象,龍芯 3A4000 依然可能會是 2019 年國內可以買到的單核性能最強的國產自主處理器。龍芯處理器和 Intel、AMD 的高性能處理器差距還是非常巨大,龍芯要走的路還很長

。期待龍芯在未來採用更好的工藝,更優化的微架構,也期待龍芯能夠在編譯器、數學庫、操作系統等系統軟件支持上有更好的表現,構建更好的應用軟件生態系統,期待著龍芯 3A4000、3B 4000、 龍芯 3C 5000 早日流片成功。


超能網


它在用戶間名聲有多大,基本就能反應出性能高低。


有點意思啊嘞


性能如何,沒接觸過,不知道。

比起性能,指令集的生態更重要,生態成熟了,多廠商加入,資本注入,人才湧入,驅動行業發展,性能提升是很快的。

生態太差,就沒有動力做器件,做出來實際意義也不大,很難單獨把性能做上去。


分享到:


相關文章: