我"芯"飞扬 2019年国产AI芯片盘点

随着人工智能的日日雄起,AI相关产业的商用场景正逐步大规模落地,科大讯飞董事长刘庆峰在接受媒体时就曾不止一次表示,2019年是AI应用落地,人工智能红利期已经到来。受此共识影响,国内AI领域自2019正式进入发展蓬勃期,各种应用层出不穷,与之对应的,是国产智能芯片后来居上。2019年,国内各大科技巨头都研发了哪些AI芯片?下面我们就一起来看看。

1.昆仑芯片

2019年尾声,百度宣布首款AI芯片昆仑已经完成研发,将由三星代工生产。该芯片使用的是三星14nm工艺技术,封装解决方案采用的是I-Cube TM。

我

据悉,昆仑AI芯片提供512Gbps的内存带宽,在150瓦的功率下实现260TOPS的处理能力,能支持语音,图像,NLP等不同的算法模型,其中ERNIE模型的性能是T4GPU的三倍以上,兼容百度飞桨等主流深度学习框架。该款芯片主要用于云计算和边缘计算,预计在2020年初实现量产。

2.科大讯飞AI 语音芯片 CSK400X 系列

2019年10月24日,科大讯飞在第三届1024全球开发者节上发布了讯飞联合生态合作伙伴打造的家电行业专用 AI 语音芯片 CSK400X 系列,以及基于CSK400X的四套智能家电模组。

我

CSK400X算力可达到128GOPS,通过深度神经网络算法解决家居中的噪音问题,支持200个唤醒词作为命令词,可帮助开发者加速对家电语音功能的开发。此外,根据家电的不同需求,科大讯飞将这些芯片分成了几类,比如旗舰版的双麦的离线模组,云加端的双麦模组,甚至还提供纯粹的支持语音合成的模组。这些功能丰富且效果领先的芯片模组拥有高度的性价比,能够让家电的智能语音功能开发在很低的成本下集成高水平的语音能力。

3.含光800

2019年的杭州云栖大会上,达摩院院长张建锋展示了一款号称全球最强 AI芯片——含光800。在业界标准的 ResNet-50 测试中,含光 800 推理性能达到 78563 IPS,比目前业界最好的 AI 芯片性能高 4 倍;能效比500 IPS/W,一个含光800的算力相当于10个GPU。

我

目前,含光800已经实现了大规模应用于阿里巴巴集团内多个场景,例如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。以杭州城市大脑实时处理1000路视频为例,过去使用GPU需要40块,延时为300ms,单路视频功耗2.8W;使用含光800仅需4块,延时150ms,单路视频功耗1W。

4.昇腾910

2019年8月,华为在深圳总部发布AI处理器Ascend 910(昇腾910),据华为发布的参数显示,昇腾910是一款具有超高算力的AI处理器,其最大功耗为310W,华为自研的达芬奇架构大大提升了其能效比。八位整数精度(INT8)下的性能达到512TOPS,16位浮点数(FP16)下的性能达到256 TFLOPS。

我

作为一款高集成度的片上系统(SoC),除了基于达芬奇架构的AI核外,昇腾910还集成了多个CPU、DVPP和任务调度器(Task Scheduler),因而具有自我管理能力,可以充分发挥其高算力的优势。

昇腾910集成了HCCS、PCIe 4.0和RoCE v2接口,为构建横向扩展(Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。HCCS是华为自研的高速互联接口,片内RoCE可用于节点间直接互联。最新的PCIe 4.0的吞吐量比上一代提升一倍。

5.征程二代

2019世界人工智能大会中,人工智能芯片初创公司地平线正式宣布量产中国首款车规级人工智能芯片——征程二代,并且获得五个国家市场客户的前装定点项目。

我

据介绍,征程二代于2019年初流片成功,搭载地平线自主创新研发的高性能计算架构BPU2.0(Brain Processing Unit),可提供超过4TOPS的等效算力,典型功耗仅2瓦,满足AEC-Q100标准,算力利用率超过90%,每TOPS算力可以处理的帧数可达同等算力GPU的10倍以上,识别精度超过99%,延迟少于100毫秒,多任务模式下可以同时跑超过60个分类任务,每秒钟识别目标数可以超过2000个。

6.邃思DTU

2019年发布会上,由腾讯领投、融资累计超过6亿元的AI芯片公司燧原科技,发布自主研发的首款AI训练芯片"邃思DTU"。

我

邃思DTU采用格罗方德12nm FinFET工艺,480平方毫米主芯片上承载141亿个晶体管,实现2.5D高级立体封装,据称单卡单精度算力为业界第一,达20TFLOPS,首次支持混合精度,半精度及混合精度下算力达80TFLOPS,最大功耗仅225W。

邃思芯片基于可重构芯片的设计理念,计算核心包含32个通用可扩展神经元处理器(SIP),每8个SIP组合成4个可扩展智能计算群(SIC)。SIC之间通过 HBM 实现高速互联,通过片上调度算法,数据在迁移中完成计算,实现了 SIP 利用率最大化。

7.思元220芯片

寒武纪在第21届高交会正式发布边缘AI系列产品思元220(MLU220)芯片及M.2加速卡产品,标志寒武纪在云、边、端实现了全方位、立体式的覆盖。

我

思元220芯片采用了寒武纪在处理器架构领域的一系列创新性技术,其架构为寒武纪最新一代智能处理器MLUv02,实现最大32TOPS(INT4)算力,而功耗仅10W,可提供16/8/4位可配置的定点运算。作为通用处理器,支持各类深度学习技术,支持多模态智能处理(视觉、语音和自然语言处理),应用领域广泛,客户可以根据实际应用灵活的选择运算类型来获得卓越的人工智能推理性能。

上面我们盘点了2019年国内科技企业发布的7款AI芯片,每款芯片的出现,都令人热血澎湃,大感振奋,意味着我国在错失了计算机处理芯片风口的同时,在AI领域终于弯道超车。

实际上除了国内企业外, 2019年,国外一些企业也发布了几款性能强悍的AI芯片,如:总部位于英国布里斯托的Graphcore公司推出了迄今为止最复杂的处理器芯片——Graphcore IPU;亚马逊云服务业务AWS发布的高性能机器学习加速芯片Inferentia;英特尔推出的面向训练 (NNP-T1000) 英伟达发布的全新的软件定义自动驾驶平台——NVIDIA DRIVE AGX Orin——中内置的全新Orin系统级芯片等。


分享到:


相關文章: