中国在2020年能否够实现百亿亿次级的计算能力?


中国在2020年能否够实现百亿亿次级的计算能力?


在超级计算机世界里,“千万亿”次级和“百亿亿”次级不仅仅是3个数量级的区别。

以每秒浮点运算次数(FLOPS)为单位,千万亿次浮点运算(petaflop,即1015FLOPS)能力意味着一种可商用的高性能计算(HPC)。在商用高性能计算领域内,硬件就是硬件,最为重要的是以尽可能低的成本提高处理速度。

现在,美国、中国、日本以及欧盟都在努力达到百亿亿次浮点运算(petaflop,即1015FLOPS)能力。中国已宣布将于2020年实现这一目标。

何时能够突破百亿亿次级的障碍?何时计算机的理论峰值性能可超过1百亿亿次或何时最大真实计算速度可达到1百亿亿次?这是一个好问题。事实上,计算能力的绝对值已经不像以前那么重要了。

“现在更趋向于定制专用系统的开发。”高性能计算咨询公司Hyperion Research的研究与技术副总裁鲍勃•索伦森(Bob Sorensen)说,“我们发现,高性能计算硬件的专业化几乎已成为一种趋势,这与千篇一律的通用解决方案恰恰相反。”

据田纳西大学电气工程与计算机科学教授杰克•唐加拉(Jack Dongarra)介绍,美国的百亿亿次级计算项目包括3台独立的计算机,仅硬件总成本就达到18亿美元。他说,百亿亿次级算法和应用的开发成本可能也会达到18亿美元。

至于电费,目前还不清楚每台计算机的耗电量究竟有多少。最近的一项粗略的估算显示,中国在建的百亿亿次系统的耗电量为65兆瓦。如果计算机连续运行1年,仅电费一项费用将高达约6000万美元。

唐加拉说,他怀疑在2021年甚至2022年之前,任何国家都无法开发出持续计算能力达到百亿亿次的系统。他说,在美国,有两台百亿亿次级计算机将用于公共研发,包括地震分析、天气和气候建模以及人工智能研究;另一台将留作国家安全研究,如模拟核武器。

“第一台计算机将在位于芝加哥附近的阿尔贡国家实验室的开放科学实验室进行开发,被命名为Aurora(也称A21)。”唐加拉说。该计算机装有英特尔处理器,由克雷公司研发放置超级计算机200多个机柜之间的互联结构。据报道,A21架构带有英特尔傲腾内存模块,这是动态随机存储器(DRAM)和闪速存储器的混合模块。2021年部署完成时,该计算机的峰值计算能力可达1百亿亿次。

美国的另一部开放科学计算机,位于田纳西州的橡树岭国家实验室,将被命名为Frontier,预计在2021年晚些时候推出,其峰值计算能力接近1.5百亿亿次。其AMD处理器将分布在100多个机柜内,每个CPU将配置4个图形处理单元。

第三台计算机,El Capitan将在加利福尼亚州的劳伦斯利弗莫尔国家实验室内运行。预计其峰值计算能力也将达到1.5百亿亿次。El Capitan将于2022年推出,其用户仅限于国家安全领域。

唐加拉说,在中国已宣布的3个百亿亿次级项目中,各项目也都具有自己的相应配置和硬件。在某种程度上,由于特朗普挑起的中美贸易战,中国将开发自有处理器和高速互联系统。

东加拉指出:“中国在高性能计算开发方面非常积极。早在2001年,500强名单中并无中国产计算机。但是现在,中国计算机已经占据支配地位。”截至2019年6月,在世界500台最快的超级计算机中,有219台是中国制造,而美国只有116台。(如果将每台计算机的千万亿次浮点运算能力加在一起统计,数字会略有不同。按性能计算,美国拥有世界上38%的高性能计算资源,而中国拥有30%。)

中国的3个百亿亿次级系统都是围绕中国生产的CPU建造的。中国国防科学技术大学系统所用的CPU尚未公布;中国国家并行计算机工程与技术研究中心系统使用的是基于ARM的无加速CPU;高性能计算公司中科曙光系统使用的是中国海光公司所生产AMD许可的x86架构带加速CPU。

日本未来的百亿亿次级机器Fugaku正由日本富士通和日本理化学研究所共同研发,采用了ARM架构。欧盟也在进行百亿亿次级项目的研发,最引人关注的是欧洲处理器计划,据唐加拉推测,该计划可能会采用开源RISC-V架构。

索伦森说,4个主要玩家——中国、美国、日本和欧盟,都已全身心投入到自有CPU和加速器技术的研发中。“这是各种引人关注的架构的重生, ”他说,“大量创新将会诞生。”


本文转自IEEE_China微信公众号


分享到:


相關文章: