龍芯不如聯發科?跟在ARM身後吃土笑話龍芯自主研發?

在吃了學院風的虧之後,龍芯調整了導向,徹底從做研究轉變到做產品上:

一是龍芯1號系列結合特定應用,如宇航、石油、流量表等研製專用芯片,因為專用芯片產業鏈短,容易形成技術優勢並快速形成銷售。其中,面向宇航應用的龍芯1E和1F被應用於北斗衛星等航天器上,成為龍芯公司重要的收入來源。值得一提的是,龍芯1E和龍芯1F的性能為200MIPS,售價僅為幾萬元一片,而西方願意出售給中國的宇航級芯片中,像性能為100MIPS的美國ATMELAT697要20萬到30萬一片,性能更好價格高達上百萬元一片。

二是龍芯2號系列SOC芯片不追求“大而全”的複雜度,而是重視結合用戶需求定義芯片,以及SOC片內互連的通暢性。

三是龍芯3號系列多核CPU不追求CPU核的個數,或某項特定性能,而是大幅度提高單核性能。放棄高性能機專用CPU的研製,暫停16核處理器研製,重點把雙核、四核處理器做精做透。

龍芯不如聯發科?跟在ARM身後吃土笑話龍芯自主研發?

在2012年年底,龍芯開啟了3A2000 的研究,放棄了過去過於看重某項指標的做法,轉而專注於提升單核性能。

這裡專門說明一下單核性能的重要意義。由於在桌面環境,程序大多是串行的,這直接導致如果單核性能上不去,堆核心數毫無意義,即便做出了八核CPU,往往會導致“一核有難,七核圍觀”的情況。

AMD的CPU過去幾年一直被壓著打,就是因為單核性能明顯遜色於Intel。在銳龍CPU和新內核Zen問世之後,之所以AMD的市場份額有所回升,也是因為單核性能上縮小了和Intel的差距。

提高處理器單核性能,提高主頻和優化芯片微結構不可偏廢,只把主頻做高,而忽視芯片微結構設計是會出大問題的,這方面最典型的案例就是Intel的奔騰4處理器,雖然擁有很高的主頻,但在微結構設計上存在很大不足,因而獲得“高頻低能”處理器的稱號,成為人類CPU發展史上的反面教材。

龍芯不如聯發科?跟在ARM身後吃土笑話龍芯自主研發?

而要提升主頻,一方面可以通過物理設計優化實現,另一方面可以通過採用更好的製造工藝提升晶體管集成度來實現。

而優化芯片微結構設計,實現CPU性能的飛躍,就非常考驗一個CPU設計團隊的功底了。微結構也就是CPU的內核,現在大家經常聽到的四核、八核CPU,就是把四個、八個CPU的內核集成到一片硅片上。

目前,國內具備高性能CPU核設計能力的僅有龍芯、申威等少數幾個團隊。國內絕大多數商業公司,特別是那些走技術引進路線的CPU公司,其CPU核高度依賴境外廠商。

以聯發科等中國芯片設計的龍頭企業來說,在過去10年裡,先後從ARM公司購買了Cortex A7、A9、A17、A53、A55、A72、A73等......CPU內核全部從ARM公司購買,賣出去的上億片手機芯片,CPU核的源代碼,沒有一行是自己寫的。

龍芯不如聯發科?跟在ARM身後吃土笑話龍芯自主研發?

由於一些技術引進公司通過引進國外先進技術,並藉助ARM比較成熟的軟件生態在商業上取得了成功,為了搶佔輿論話語權,標榜自己的高科技光環,竭力將買CPU核集成芯片鼓吹為高科技。但實際上,買CPU內核集成芯片的設計工作可以通過完整的流程,成體系的工具來實現,對人的要求沒有這麼高,屬於短平快的模式。

處理器的核心技術在於:cache一致性協議,存儲一致性模型,可擴展性結構,多核的片上互連結構,多路的互連結構,訪存的通路,IO的互連結構等等。

龍芯不如聯發科?跟在ARM身後吃土笑話龍芯自主研發?

從處理器核的設計角度,多端口的訪存,低延遲高帶寬的cache,高精度的分支預測器,高效率的預取機制,用於挖掘指令級並行性的大框架,用於挖掘數據級並行性的高寬度simd,用於挖掘線程級並行性的多線程機制,處理器低功耗技術,以及各種處理器設計涉及到的電路技術和工藝磨合等技術都是非常關鍵的。

而這些技術細節則是龍芯攻關的重點方向。


分享到:


相關文章: