01.12 管中窥豹,国产最强CPU发展图谱下的中国芯往事

偶然见到了一张飞腾的CPU演进图谱,上面大约记录了飞腾历史上的所有产品,包括了飞腾技术团队从1999年开始至2014年飞腾成立公司之前,在国防科大期间的研究成果。


管中窥豹,国产最强CPU发展图谱下的中国芯往事

挖掘国产CPU隐藏的故事

但是在飞腾的公司官网上,在FT1500之前的处理器竟然从来没有出现过,对于一个CPU企业来说,缺失了一半的产品介绍,很不正常。


管中窥豹,国产最强CPU发展图谱下的中国芯往事

在收集资料的过程中,我深深体会到了我国半导体行业面对国外技术封锁之无奈,我国芯片技术研究之艰难,以及至今仍然存在的发展窘境,令人沉默,令人心酸。然而飞腾在艰难的条件下取得的成就又是那样巨大耀眼,令人自豪,令人骄傲。

一步一个脚印的国产CPU

国防科大先后尝试了X86、Epic(VLIW,惠普把IA-64命名为Epic)、SPARC、ARM四个指令集,并以Sparc开源代码为基础设计了FT-1000和FT-1500两款CPU,之后,飞腾选择了ARM阵营。


管中窥豹,国产最强CPU发展图谱下的中国芯往事

使用SPARC架构的飞腾计算节点

为了绕开外国的技术封锁,获取有限的技术资源,只得如游鱼一般频繁改变前进路线,从仿制产品,到使用开源设计,之后再依赖技术授权,一步一个脚印,每一步都开启新的征程。

在1999年至2005年间,飞腾团队研发了至少4款(查得资料中有更多)产品,或许不能称之为产品,因为这4款CPU中至少有两款是仿制的Intel的产品,没有Intel的授权也就不能公开出售,但如果用于武装装备或其它保密设备Intel也无法追究。

在当时“仿制”其实大多是“反向工程”,就是把CPU拆开炭化剥离后,再在显微镜下一层一层地扫描电路重新绘制,对于数字电路的逆向远比模拟电路艰难,国内能完成CPU仿制的团队并不多见。

当时少有通过正向设计进行仿制的团队,通过反向工程进行学习和借鉴也是常见的手段。还有一些团队选择从头自行开发,从设计到生产走完所有流程。

为了保障关键设备安全可控,在我国半导体工业和技术十分薄弱的年代,各个技术团队缺少理论研究,没有经验积累,大多只能通过仿制来获取某些关键元器件,真是说不尽的辛酸,道不尽的无奈。

通过反向做到对标国外一流CPU

年代久远,飞腾前面几款CPU难以找到相关资料,只对飞腾团队最后仿制的FT64找到了一些只言片语的描述。它的原型应该是Intel的IA-64构架的Itanium 2。

管中窥豹,国产最强CPU发展图谱下的中国芯往事

当时的CPU制程都比较低,Itanium 2的制程只有0.18µm,换算成现在流行的nm就是180nm,放大1000倍就是0.18mm,在显微镜下能够清晰可见。


管中窥豹,国产最强CPU发展图谱下的中国芯往事

显微镜下CPU走线

因此短短几年就完成了至少4款互相没有技术路线关联的CPU,平均每款CPU开发周期最多只用了一年半。

2005年FT64的浮点计算性能就达到了16 GFLOPS,而同期走正向设计的龙芯在2006才发布的2E型CPU浮点性能仅堪堪达到3.99 GFLOPS,不到FT64的1/4,无法满足信息化建设的需要,说明在当时仿制国外产品才是快速实现CPU国产化的捷径,飞腾为各种装备的国产化作出了巨大贡献。

大胆丢包袱,转向SPARC

由于CPU制程越来越高,内部设计也越来越复杂,仿制产品也就变得越来越艰难。飞腾团队迅速转变思路,找到了对CPU更新换代的其它方法。

在2006和2007年,SUN 开源了 Sparc V9 架构的高性能服务器CPU——UltraSPARC T1 和 T2,飞腾抓住了机会,以开源的CPU设计为基础,仅用了短短三年时间,在2009年底发布了对标UltraSPARC T2的FT-1000。

尽管是使用开源设计,但并不影响飞腾的壮志雄心,飞腾团队又花了3年时间,成功地把原本的8核设计改成了16核,在2012年底发布了FT-1500。

这也从侧面反映了当时国内CPU技术方面的羸弱,从现成的源码到产品也花了3年,从8核改成16核又花了3年。

尽管过程很艰难,但收获很丰盛,2012年发布的FT-1500在1.8GHz的频率下,16核峰值性能达到了惊人的115~144 GFLOPS。

2010年,在对国防科大建造的“天河一号”超算进行二期扩充升级时,加入了2048颗FT-1000作为一部分机组的服务节点,尽管与数万颗Intel和AMD芯片相比并不起眼,但却是飞腾CPU在国产超算中首次使用。


管中窥豹,国产最强CPU发展图谱下的中国芯往事

媒体宣传中大量出现的类似“天河一号CPU采用的是国产飞腾,二期系统的峰值性能和持续性能分别提高了2.89倍和3.45倍。”这样的文字,极大地满足了人们对国产CPU的期待,提振了国民对科技领域的信心。

后来,国防科大在天河二号一期建造中则使用了4096个FT-1500芯片用于处理网络数据,使用了32000颗“Xeon处理器和48000颗“XeonPhi”协处理器来作为计算节点,媒体盛传“使用了飞腾CPU的天河二号成为2013年全球最快超级计算机”,记录了飞腾在国内超算领域得到的应用和实践。

拥抱ARM v8,打造国产ARM最强芯

可惜的是,在SUN被Oracle收购之后,就再也没有开源SPARC架构新的CPU设计,但是真正的勇士总是不惧否定自己过往的成绩,永远不会在布满荆棘的道路上踽踽独行。


管中窥豹,国产最强CPU发展图谱下的中国芯往事

2011年末ARM公司宣布了ARMv8架构诞生,在2012年中开始对外授权。飞腾团队毫不犹豫地选择了追随ARM的技术路线,尽管授权费用高昂但得大于失,各种技术资源的完备性是以前无法比拟的。

即使从ARM开放架构授权的时间计算,也仅仅两年就完成了从零开始设计ARMv8架构新一代CPU的任务,2014年10月就推出了型号为FT-1500A的4核和16核版两款CPU,远远高于之前使用SPARC开源设计时两款CPU花了6年的效率,除了得益于ARM有效的技术支持,这也说明技术团队的水平有了极大的提高。

飞腾的第一款ARM架构的CPU就达到了与ARM Cortex A57公版核心相近的同频性能,成为了无可争议的国产芯性能第一。飞腾团队的实力与十多年来飞腾团队博采众家获得的技术积累不无关系,这一支技术团队终于在国外技术封锁的环境中走出了新的发展路径。

结语

我国的半导体技术发展之路,长期以来就处在嘲讽和质疑的声音中,放弃愤怒,勇猛前进,逐步形成替代国外的产品的竞争力。

飞腾是国内CPU企业的典型,面对外国的技术封锁,从20年前开始通过仿制国外产口来积累宝贵的技术和经验,在崇山峻岭间捡拾国外遗落的设计资料,在夹缝中不停转进,最后再以市场为导向获得了国外企业的技术授权,终于能够在市场中占据一席之地,从小处着手开始参与市场竞争。

正如那张飞腾CPU的演进图谱中写的那样:不忘初心,牢记使命。


管中窥豹,国产最强CPU发展图谱下的中国芯往事



欢迎关注芯故事,一起探索中国芯片和软件背后不为人知的故事。


分享到:


相關文章: