您的位置:4166.com > 电工电气 > “中国芯”寒武纪,发布全新AI芯片产品

“中国芯”寒武纪,发布全新AI芯片产品

2019-12-01 05:33

电工电气网】讯

国内首款云端人工智能芯片发布理论峰值速度达每秒128万亿次定点运算,达到世界先进水平

5月3日,智能芯片公司寒武纪科技在上海举办了2018产品发布会。会上,寒武纪正式发布了多个最新一代终端IP产品——采用7nm工艺的终端芯片Cambricon 1M、首款云端智能芯片MLU100及搭载了MLU100的云端智能处理计算卡。

云端智能芯片是面向人工智能领域大规模数据中心和服务器提供的核心芯片。5月3日,中国科学院发布国内首款云端人工智能芯片,理论峰值速度达每秒128万亿次定点运算,达到世界先进水平,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域——

在人工智能技术的发展过程中,神经网络正不断迈向更深、更复杂的方向,而硬件则正朝着机器学习任务处理专用的道路前进。目前,国内已出现十余家人工智能芯片公司,而寒武纪是其中的佼佼者。作为全球唯一一家AI芯片独角兽,寒武纪于2016年诞生于中国科学院计算技术研究所,并率先推出了商用化的深度学习专用处理器NPU。

4166.com 1

其实,寒武纪科技的产品早已进入普通用户的手中。去年10月,华为发布了搭载全球首款“人工智能处理器”麒麟970的手机Mate 10系列(以及其后发布的华为P20、荣耀V10系列等),其芯片架构中就包含了寒武纪的Cambricon-1A神经网络处理器。1A也由此成为了全球首个成功商用的深度学习处理器IP产品。

智能芯片是前沿科技和社会关注的热点,也是人工智能技术发展过程中不可逾越的关键环节。可以说,不论有怎样领先的算法,要想最终应用,都必须通过芯片实现。

寒武纪的智能处理器主要针对于人工智能领域计算机视觉、语音识别等方面的任务,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类应用。据称,其专为神经网络任务优化的架构可以使其达到传统四核CPU25倍以上的性能。

5月3日,全球新一代人工智能芯片发布会在上海召开,中科院旗下的寒武纪科技公司发布了我国自主研发的Cambricon MLU100云端智能芯片和板卡产品、寒武纪1M终端智能处理器IP产品。这款国内首个云端人工智能芯片,理论峰值速度达每秒128万亿次定点运算,达到世界先进水平。

与此前仅面向终端设备的芯片IP不同,本次发布会上,寒武纪推出的芯片不仅性能更强大,而且还出现了面向云端服务器等专业应用场景的产品。

作为此次发布会焦点,首次正式亮相的Cambricon MLU100云端智能芯片,是我国首款云端AI芯片。

第三代终端芯片:寒武纪1M

据中科院计算所研究员、寒武纪公司创始人兼CEO陈天石介绍,云端智能芯片是面向人工智能领域大规模数据中心和服务器提供的核心芯片。云端的智能芯片规模更大,结构更加复杂,它和终端芯片的最大区别就在于其运算能力更强。

首先是终端处理器部分。今天发布的寒武纪1M是这家公司的第三代机器学习专用芯片,其性能超越此前广泛使用的寒武纪1A十倍。去年11月6日,寒武纪在北京举行了公司成立以来的首场发布会,陈天石在会上披露了1M处理器的发展计划。

MLU100云端智能芯片采用寒武纪最新的MLUv01架构和TSMC 16nm的先进工艺,可工作在平衡模式和高性能模式下,平衡模式下的等效理论峰值速度达每秒128万亿次定点运算,高性能模式下的等效理论峰值速度更可达每秒166.4万亿次定点运算,但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。

在本次发布会上,寒武纪1M处理器的具体参数终于展示在人们的眼前。1M使用TSMC 7nm工艺生产,其8位运算效能比达5Tops/watt。寒武纪提供了三种尺寸的处理器内核(2Tops/4Tops/8Tops)以满足不同场景下不同量级智能处理的需求,寒武纪称,用户还可以通过多核互联进一步提高处理效能。

“3年来,我们从研发两颗测试芯片,一直到现在云端智能芯片的最终亮相,我们时刻准备着‘由端入云’。”陈天石说,MLU100基于软硬件协同提升内存带宽利用率,不管是从性能比,还是功耗比来说,寒武纪都将树立智能芯片领域的新标杆。

寒武纪1M处理器延续了前两代IP产品的完备性,可支持CNN、RNN、SOM等多种深度学习模型,此次又进一步支持了SVM、k-NN、k-Means、决策树等经典机器学习算法的加速。这款芯片支持帮助终端设备进行本地训练,可为视觉、语音、自然语言处理等任务提供高效计算平台。“这意味着使用1M的设备可以根据用户行为对应用进行个性化定制,”陈天石表示。“本地训练同时也解决了用户数据隐私的问题。它是全球第一款支持本地机器学习训练的智能处理器产品。”据悉,该产品可应用于智能手机、智能音箱、摄像头、自动驾驶等不同领域。

与寒武纪系列终端处理器一样,MLU100云端芯片仍然延续了寒武纪产品一贯出色的通用性,可支持千万量级用户的大规模商用检验,搭载各类深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等领域复杂场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。

首款云端智能芯片:MLU 100

此外,这次最新发布的寒武纪1M处理器是公司的第三代IP产品,它延续了前两代产品卓越的完备性,单个处理器核即可支持多样化深度学习模型,并更进一步支持经典机器学习算法和本地训练,为视觉、语音、自然语言处理以及各类经典的机器学习任务提供了灵活高效的计算平台,将广泛应用于智能手机、智能音箱、智能摄像头、智能驾驶等不同领域。

在去年11月份的发布会上,陈天石展示了服务器级AI处理器MLU系列的发展计划,寒武纪希望将自己的产品从神经网络加速拓展到机器学习,以及更多任务中。本次发布的又一大重点就是首次亮相的Cambricon MLU 100云端AI芯片,以及以此为基础的云端智能处理计算卡。“在三年前,我们就开始了两颗测试芯片的研发了。我们时刻准备着将自己的产品放入云端。”陈天石表示。今天推出的产品正是寒武纪稳步推进的成果。

寒武纪科技公司脱胎于中科院计算所,于2016年发布了全球首款商用深度学习专用处理器——寒武纪1A处理器。它的横空出世打破了多项纪录,并入选了第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。目前,寒武纪处理器也已应用于某知名国产手机新近发布的旗舰机型,实现了集成应用。

MLU100采用寒武纪最新的MLUv01架构和TSMC 16nm工艺,可工作在平衡模式和高性能模式主频下,等效理论峰值速度则分别可以达到128万亿次定点运算/166.4万亿次定点运算,而其功耗为80w/110w。与寒武纪系列的终端处理器相同,MLU100云端芯片具有很高的通用性,可支持各类深度学习和常用机器学习算法。可满足计算机视觉、语音、自然语言处理和数据挖掘等多种云处理任务。搭载这款芯片的板卡使用了PCIe接口。

近年来,人工智能产业迅猛发展,推动了芯片市场规模的快速增长,也推动了人工智能计算从终端向云端的延伸。陈天石表示,寒武纪在技术上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独立完成各种复杂的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端在统一的智能生态基础上协同完成复杂的智能处理任务。

在发布会上,寒武纪的合作伙伴们展示了基于寒武纪芯片的部分应用方案。其中联想推出了基于Cambricon MLU100的服务器ThinkSystem SR650。该产品为2U2路机架式规格,支持两个MLU100智能处理器计算卡。这款服务器打破了37项服务器基准测试的世界纪录。

陈天石指出,端侧智能处理可以最快速响应用户需求,以非常低小的功耗、成本和延迟,帮助用户理解图像、视频、语音和文本。同时,云侧的智能处理则可以把多个端的信息汇聚在一起。由于终端的数据量有限,只能根据单个用户的数据对机器学习模型进行微调。因此,端云协同的智能处理模式将在数据方面发挥巨大优势,利用海量数据,训练出强大的人工智能模型。

中科曙光也在发布会上推出了基于Cambricon MLU100的服务器产品系列“PHANERON”。这款服务器可支持2-10块寒武纪MLU处理卡,面向多种智能应用任务。其中PHANERON-10集成了10块寒武纪人工智能处理单元,可以为人工智能训练应用提供832T半精度浮点运算能力,在推理时提供1.66P整数运算能力。中科曙光表示,新一代服务器可以在典型场景下将能效提升30倍以上。

4166.com,“过去大部分芯片厂商都主攻端,例如芯片巨头ARM公司,或是主攻云,例如英特尔公司。两者兼顾的却很少,因为端云的任务生态区别较大。但是智能时代这个局面会被全面打破。因为端和云的任务是一体的,编程和使用的生态也是一致的。作为一个通用机器学习芯片厂商,寒武纪就是要端云结合,共同推动智能芯片生态的发展。”陈天石说。

科大讯飞也在发布会上披露了与寒武纪的深度合作研发项目。

中科院上海分院副院长、中科院院士张旭表示,从过去在手机等终端上应用的智能芯片,到今天更高一层的云端人工智能芯片,它可以使人们在手机等终端的应用上升为未来在云端等领域更加广阔的应用,所以这是一个开拓性的突破。

正如MLU的系列命名所示,寒武纪希望把旗下芯片的应用范围由神经网络(Neural network)扩展到机器学习(Machine Learning)的加速任务上。由于IP授权的方式利润空间有限,进军云端市场或许是寒武纪作为新一代芯片公司发展的必然道路。

当前,众多科技公司纷纷加大对人工智能芯片的研发,包括智能手机、无人驾驶、云计算等各领域巨头。根据相关机构预测,到2021年,人工智能芯片市场规模将超过110亿美元,而2016年这一数字仅为36亿美元。

寒武纪表示,旗下的终端和云端产品均原生支持寒武纪NeuWare软件工具链,可以方便用户进行智能应用的开发、迁移和调优。陈天石表示,寒武纪科技创立的初衷就是要让全世界都能用上智能处理器。寒武纪本次提出了“端云协作”的理念,这次发布的MLU100芯片可以和此前寒武纪1A/1H/1M系列终端处理器进行适配,协同完成复杂的智能处理任务。

“寒武纪创立的初衷就是要让全世界都能用上智能处理器。”陈天石告诉记者,寒武纪将秉承学术界开放、协作的精神,以处理器IP授权的形式与全世界同行共享寒武纪最新的技术成果,使全球客户能够快速设计和生产具备人工智能处理能力的芯片产品。

本文由4166.com发布于电工电气,转载请注明出处:“中国芯”寒武纪,发布全新AI芯片产品

关键词: