我们非常重视您的个人隐私,当您访问我们的网站时,请同意使用的所有cookie。有关个人数据处理的更多信息可访问《使用条款》

国内首款云端人工智能芯片发布

2023.07.21 鲁邦通编辑部

阅读量:228

分享:

5月3日,中国科学院发布了中国首款云人工智能芯片,理论峰值速度达到每秒128万亿次,达到世界先进水平,将广泛应用于智能手机、智能扬声器、智能摄像头、智能驾驶等不同领域。

云智能芯片是为人工智能领域的大型数据中心和服务器提供的核心芯片。5月3日,中国科学院发布了中国首款云人工智能芯片,理论峰值速度达到每秒128万亿次,达到世界先进水平,将广泛应用于智能手机、智能扬声器、智能摄像头、智能驾驶等不同领域。

智能芯片是前沿技术和社会关注的热点,也是人工智能技术发展过程中不可逾越的关键环节。可以说,无论算法有多领先,最终应用都必须通过芯片实现。

5月3日,全球新一代人工智能芯片发布会在上海举行。中国科学院寒武纪科技公司发布了中国自主研发的cambricon MLU100云智能芯片和板卡产品,寒武纪1M终端智能处理器IP产品。这款国内首款云人工智能芯片,理论峰值速度为每秒128万亿次,达到世界先进水平。

智能芯片取得了新的突破

Cambriconn作为本次发布会的焦点,首次正式亮相 MLU100云智能芯片是中国首款云AI芯片。

据中国科学院计算研究所研究员、寒武纪公司创始人兼首席执行官陈天石介绍,云智能芯片是人工智能领域大规模数据中心和服务器提供的核心芯片。云智能芯片规模更大,结构更复杂。它与终端芯片最大的区别在于它具有更强的计算能力。

MLU100云智能芯片采用最新的MLUV01架构和TSMC 16nm的先进工艺可以在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下工作,平衡模式下的等效理论峰值速度可以达到每秒128万亿次,高性能模式下的等效理论峰值速度可以达到每秒166.4万亿次。但典型板级功耗仅为80瓦,峰值功耗不超过110瓦。

“在过去的三年里,从开发两个测试芯片到云智能芯片的最终出现,我们一直在准备‘从端到云’。”陈天石表示,MLU100将在性能比和功耗比方面建立智能芯片领域的新标杆,基于软硬件协调提高内存带宽利用率。

和寒武纪系列终端处理器一样,MLU100云芯片仍然延续了寒武纪产品的优秀通用性,可以支持数千万用户的大规模商业检验,配备各种深度学习和经典机器学习算法,充分满足视觉、语音、自然语言处理、经典数据挖掘等复杂场景(如大数据、多任务、多模式、低延迟、高通量)的云智能处理需求。

此外,最新发布的寒武纪1M处理器是公司的第三代IP产品,延续了前两代产品(寒武纪1H/1A)的卓越完整性。单个处理器核可以支持多元化的深度学习模型,进一步支持经典的机器学习算法和本地培训,为视觉、语音、自然语言处理和各种经典的机器学习任务提供灵活高效的计算平台。它将广泛应用于智能手机、智能扬声器、智能摄像头、智能驾驶等不同领域。

协调发展“从端到云”

寒武纪科技有限公司诞生于中国科学院计算所,于2016年发布了世界上第一款商业深度学习专用处理器——寒武纪1A处理器。它的诞生打破了许多纪录,入选了第三届世界互联网会议评选的15项“世界领先的互联网技术成果”。目前,寒武纪处理器也已应用于国内知名手机最近发布的旗舰机型,实现了综合应用。

近年来,人工智能产业的快速发展促进了芯片市场规模的快速增长,也促进了人工智能计算从终端向云的延伸。陈天石表示,寒武纪在技术上贯彻“端云合作”的理念。MLU100云芯片不仅可以独立完成各种复杂的云智能任务,还可以完美适应寒武纪1A/1H/1M系列终端处理器,让终端和云在统一智能生态的基础上完成复杂的智能处理任务。

陈天石指出,端侧智能处理可以最快地响应用户的需求,帮助用户以非常低的功耗、成本和延迟理解图像、视频、语音和文本。同时,云侧的智能处理可以汇集多个端的信息。由于终端数据量有限,机器学习模型只能根据单个用户的数据进行微调。因此,端云协同智能处理模式将在数据方面发挥巨大优势,利用大量数据培养强大的人工智能模型。

“过去,大多数芯片制造商都专注于芯片巨头ARM或英特尔等云。由于端云的任务生态差异较大,两者兼顾的很少。但这种情况在智能时代将被完全打破。由于端和云的任务是一体的,编程和使用的生态也是一致的。寒武纪作为一家通用机器学习芯片制造商,要结合云端,共同促进智能芯片生态的发展。陈天石说。

中国科学院上海分院副院长、中国科学院院士张旭表示,从过去在手机等终端上应用的智能芯片,到今天更高层次的云人工智能芯片,可以使人们在手机等终端上的应用成为未来云等领域更广泛的应用,因此这是一个开拓性的突破。

目前,包括智能手机、无人驾驶、云计算等领域巨头在内的众多科技公司都加大了人工智能芯片的研发力度。据有关机构预测,到2021年,人工智能芯片市场规模将超过110亿美元,而2016年仅为36亿美元。

“建立寒武纪的初衷是让世界使用智能处理器。”陈天石告诉记者,寒武纪将坚持学术开放与合作的精神,以处理器IP授权的形式与世界各地的同行分享寒武纪的最新技术成果,使全球客户能够快速设计和生产具有人工智能处理能力的芯片产品。

共建人工智能生态链

在新闻发布会上,寒武纪的一些行业合作伙伴公开展示了基于寒武纪芯片的应用程序。联想集团高级副总裁童夫尧在新闻发布会上推出了基于寒武纪MLU100智能处理卡的thinkSystem SR650打破了37个服务器基准测试的世界纪录。

“在新产品中,我们配备了寒武纪芯片,帮助各行各业人工智能VR、童夫尧说:“高性能计算的研发和行业解决方案的实施。”。

不仅如此,芯片结果还将应用于智能语音领域。“在传统处理器上智能应用一小时的语音数据需要1万小时才能完成。科大讯飞一直在跟踪人工智能芯片的前沿进展。上海讯飞总裁程苏表示,寒武纪的智能处理器在语音智能处理方面给出了优秀的答案,能耗效率是竞争对手云GPU方案的5倍以上。其强大的处理能力使手机本地端能够处理更复杂的机器学习算法,使语音本地识别精度比传统处理器领先9.8%,显著提高了用户体验。

中科曙光高级副总裁任京敏在新闻发布会上同时推出了基于Cambricon的新闻发布会 MLU100智能处理卡服务器产品系列“PHANERON其性能更强,可支持2-10块寒武纪MLU处理卡,灵活应对不同的智能应用负载。以PHANERON-10升级版为例,单台服务器可集成10个寒武纪人工智能处理单元,为人工智能培训应用提供832T半精度浮点操作能力,为推理应用提供1.66P整数操作能力,典型场景能效提高30倍以上。

“下一步,曙光与寒武纪的合作将不仅局限于整机领域,还将从顶级科研延伸到低端应用,共同打造下游应用产业,共建人工智能生态链。”任景阳透露,中科曙光还将发布人工智能管理平台SothisAI,与寒武纪芯片和开发环境实现无缝对接和深度融合。

广州鲁邦通物联网科技股份有限公司成立于2010年,致力为行业客户提供软硬件结合的5G+工业互联网平台解决方案,通过设备物联、机器人乘梯、设备售后管理系统、电梯物联网等产品和服务,助力电梯及特种设备、医疗设备、机器人、环保设备、环卫设备、电力设备和水务设备等工业客户进行后市场服务的数字化转型,降本增效,开启利润增长的第二曲线。