我们非常重视您的个人隐私,当您访问我们的网站时,请同意使用的所有cookie。有关个人数据处理的更多信息可访问《使用条款》

到底什么是“算力”?这篇文章值得一看

2023.07.10 鲁邦通编辑部

阅读量:144

分享:

在这篇文章中,我们来谈谈算力。

在过去的两年里,计算能力可以说是ICT行业的一个热门概念。它总是出现在新闻报道和大咖啡演讲中。那么,什么是计算能力呢?计算能力包括哪些类别,它们的用途是什么?目前,全球计算能力的发展状态如何?接下来,文本开始了。

什么是算力

大家都知道算力的字面意思,也就是计算能力(Computing Power)。具体来说,计算能力是通过处理信息数据来实现目标结果输出的计算能力。事实上,我们人类有这样的能力。在我们的生活过程中,我们一直在计算。我们的大脑是一个强大的计算能力引擎。大多数时候,我们会通过口算和心算进行无工具计算。然而,这种计算能力有点低。因此,在遇到复杂情况时,我们会使用计算工具进行深度计算。在古代,我们的原始工具是草绳和石头。后来,随着文明的进步,我们有了算计(一根用来计算的小棍子)、算盘等更实用的算力工具,计算能力水平不断提高。20世纪40年代,我们迎来了算力革命。1946年2月,世界上第一台数字电子计算机ENIAC诞生,标志着人类计算能力正式进入数字电子时代。ENIAC,1946年后来,随着半导体技术的出现和发展,我们进入了芯片时代。芯片已成为计算能力的主要载体。

1958年,世界上第一个集成电路(芯片)

时间继续流逝。20世纪70-80年代,在摩尔定律的支配下,芯片技术取得了长足的进步。芯片性能不断提高,体积不断减小。最后,计算机实现了小型化,PC(个人电脑)诞生了。1981年PC诞生,世界上第一台PC(IBM5150)意义深远。它标志着IT计算能力不再仅仅为少数大型企业(大型机器)服务,而是向普通家庭和中小企业昂首阔步。它成功地打开了全民信息时代的大门,促进了全社会信息化的普及。在PC的帮助下,人们充分感受到了IT计算能力带来的生活质量的提高和生产效率的提高。PC的出现也为互联网的蓬勃发展奠定了基础。进入21世纪后,算力再次发生了巨大的变化。这一巨变的标志,是的云计算技术的出现。云计算,Cloud 在云计算之前,Computing遭受了人类的痛苦单点式计算(一台大型机器或一台PC,独立完成所有计算任务)计算能力不足,已经尝试过了网格计算(将一个巨大的计算任务分解成许多小的计算任务,交给不同的计算机)等。分布式计算架构。云计算是分布式计算的新尝试。其本质是包装和收集大量分散的计算能力资源,以实现更高的可靠性、更高的性能和更低的成本。具体来说,在云计算中,中央处理器(CPU)、内存、硬盘、显卡(GPU)当计算资源被收集并通过软件形成虚拟和无限扩展时“计算能力资源池”。如果用户有计算能力需求,“计算能力资源池”将动态分配计算能力资源,用户将按需支付。与用户自购设备、自建机房、自营维护相比,云计算具有明显的性价比优势。

云计算数据中心

计算能力云化后,数据中心成为计算能力的主要载体。人类的计算能力规模,开始了新的飞跃。

算力的分类

云计算和数据中心之所以出现,是因为信息化和数字化的不断深化,导致了全社会对计算能力的强烈需求。这些需求包括消费领域(移动互联网、戏剧追逐、网上购物、出租车、O2O等)、行业(工业制造、交通物流、金融证券、教育医疗等)、城市治理(智慧城市、一证通、城市大脑等)。不同的算力应用和需求有不同的算法。不同的算法对计算能力的特性也有不同的要求。通常,我们将计算能力分为两类,即通用算力和专用算力。

每个人都应该听说,负责输出计算能力的芯片分为通用芯片和专用芯片。像X86这样的CPU处理器芯片是通用芯片。他们可以完成的计算任务是多样化和灵活的,但功耗更高。

而专用芯片,主要是指FPGA和ASIC。

FPGA,它是一个可编程的集成电路。它可以通过硬件编程改变内部芯片的逻辑结构,但软件是深度定制的,执行特殊任务。ASIC,它是一个特殊的集成电路。顾名思义,它是一种为专业用途定制的芯片,其大部分软件算法都固化在硅片中。ASIC可以完成特定的计算功能,相对单一,但能耗很低。FPGA,介于通用芯片和ASIC之间。

让我们以比特币挖掘为例。过去,人们用PC(x86通用芯片)挖掘。后来,挖掘越困难,计算能力就越差。因此,开始使用显卡(GPU)去采矿。后来显卡能耗太高,挖出来的货币值抵不上电费,于是开始采用FPGA和ASIC集群阵列进行采矿。在数据中心,计算能力任务也被相应划分为基础通用计算,以及HPC高性能计算(High-performance computing)。HPC计算继续细分为三类:科学计算:物理化学、气象环境保护、生命科学、石油勘探、天文探测等。工程计算:计算机辅助工程、计算机辅助制造、电子设计自动化、电磁仿真等。智能计算:即人工智能:(AI,Artificial Intelligence)计算包括:机器学习、深度学习、数据分析等。每个人都应该听说过科学计算和工程计算,这些专业科研领域的数据产生量很大,对计算能力的要求也很高。以油气勘探为例。简单来说,油气勘探就是为地表做CT。一个项目下来,原始数据往往超过100TB,甚至超过1个PB。如此巨大的数据量需要大量的计算能力来支持。我们需要关注智能计算。人工智能人工智能是全社会关注的发展方向。无论在哪个领域,我们都在研究人工智能的应用和着陆。人工智能的三个核心要素是计算能力、算法和数据。

众所周知,AI人工智能是一个计算能力大户,尤其是“吃”计算能力。在人工智能计算中,涉及的矩阵或向量乘法和加法较多,专用性较高,不适合CPU计算。在实际应用中,人们主要使用GPU和上述特殊芯片进行计算。尤其是GPU,是目前AI计算能力的主力军。虽然GPU是图形处理器,但其GPU核(逻辑操作单元)的数量远远超过CPU, 适用于将相同的指令流并行发送到众核,并使用不同的输入数据执行,从而在图形处理或大数据处理中完成大量简单的操作。因此,GPU更适合处理计算密集型和高度并行化的计算任务(如人工智能计算)。近年来,由于人工智能计算需求旺盛,国家也专门建设了许多智能计算中心,即专门从事智能计算的数据中心。

成都智算中心(图片来自网络)

除了智算中心,还有很多超级计算中心。在超级计算中心,有“天河一号”等超级计算机,专门承担各种大规模的科学计算和工程计算任务。(图片来自网络)我们通常看到的数据中心基本上属于云计算数据中心。任务复杂,包括基本通用计算和高性能计算,以及大量的异构计算(不同类型指令集的计算方法)。由于对高性能计算的需求越来越大,特殊计算芯片的比例正在逐渐增加。TPU在几年前逐渐流行起来、NPU和DPU实际上都是特殊的芯片。我们现在经常听说事实上,“计算能力卸载”并不是删除计算能力,而是将许多计算任务(如虚拟化、数据转发、压缩存储、加密解密等)从CPU转移到NPU、在DPU和其他芯片上,减轻CPU的计算能力负担。近年来,除了基本的通用计算能力、智能计算能力和超计算能力外,科学界还出现了前沿计算能力的概念,主要包括量子计算、光子计算等,值得关注。

算力的衡量

由于计算能力是一种“能力”,当然会有指标和基准单位来衡量它的强度。大家熟悉的单位应该是FLOPS、TFLOPS等。事实上,有许多指标可以衡量计算能力的大小,如MIPS、DMIPS、OPS等。MFLOPS、GFLOPS、TFLOPS、PFLOPS等,都是不同量级的FLOPS。具体关系如下:FP16浮点数、FP32、FP64不同规格和不同计算载体之间的计算能力差异非常大。详见下表:我们前面提到了一般计算、智能计算和超级计算。从趋势上看,智算和超算的计算能力增长速度远远超过一般计算能力。据GIV统计,到2030年,通用计算能力(FP32)将增长10倍,达到3.3 ZFLOPS。AI智算算力(FP16)将增加500倍,达到105倍 ZFLOPS。早在1961年,“人工智能之父”约翰·麦卡锡就提出了Utility Computing(效用计算)目标。他说:“有一天,计算可能会被组织成公共事业,就像电话系统是公共事业一样。”现在,他的想法已经成为现实。在数字浪潮下,计算能力已成为水、电等公共基础资源,数据中心和通信网络也已成为重要的公共基础设施。这是IT行业和通信行业半个多世纪艰苦奋斗的结果。计算能力不再是整个人类社会的技术维度概念。它已经上升到经济学和哲学的维度数字经济时代的核心生产力和全社会数智化转型的基石。我们每个人的生活,工厂企业的运作,政府部门的运作,都离不开算力。我们还需要大量的计算能力,如国家安全、国防建设、基础学科研究等关键领域。计算能力决定了数字经济的发展速度和社会智能的发展高度。根据IDC、根据清华大学全球产业研究院联合发布的浪潮信息和数据,计算能力指数平均每增长1点,数字经济和GDP分别增长3.5‰和1.8‰。全球各国的计算能力规模与经济发展水平呈现出明显的正相关系。计算能力规模越大,经济发展水平越高。在算力领域,国家之间的竞争博弈日益激烈,世界各国的计算能力和GDP排名(来源:迟九虹,华为计算能力时代峰会演讲)。2020年,我国计算能总规模达到135 EFLOPS,同比增长55%,超过全球增长约16个百分点。目前,我们的绝对计算能力在世界上排名第二。然而,从人均角度来看,我们并不占主导地位,只处于中等计算能力的国家水平。世界各国人均计算能力比较(来源:唐雄燕、华为计算能力时代峰会演讲),特别是在芯片等核心计算能力技术方面,与发达国家仍有很大差距。许多掐颈技术未能解决,严重影响了我们的计算能力安全,进而影响了国家安全。因此,脚下还有很长的路要走,我们还需要继续努力。

近日,对手再次提出了光刻机的想法(来自网络的图片)

在未来的社会中,信息化、数字化和智能化将进一步加快。随着万物智联时代的到来,大量智能物联网终端的引入和人工智能智能场景的落地将产生难以想象的海量数据。这些数据将进一步刺激对计算能力的需求。根据罗兰贝格的预测,从2018年到2030年,自动驾驶对计算能力的需求将增加390倍,智能工厂的需求将增加110倍,主要国家的人均计算能力需求将从今天不到500倍 GFLOPS,增加20倍,成为2035年的1万 GFLOPS。根据浪潮人工智能研究所的预测,到2025年,全球计算能力将达到6.8 ZFLOPS,比2020年增长30倍。新一轮计算革命正在加速启动。结论计算能力是一个如此重要的资源,但事实上,我们在计算能力的使用上仍然存在许多问题。例如,计算能力利用率和计算能力分布的平衡。根据IDC的数据,目前企业分散的小计算能力利用率只有10%-15%,浪费很大。自2015年以来,摩尔定律放缓,单位能耗下的计算能量增长率逐渐被数据量增长率拉大。在不断挖掘芯片计算能力潜力的同时,必须考虑计算能力的资源调度。那么,如何调度计算能力呢?现有的通信网络技术,能否满足计算能力的调度要求?

广州鲁邦通物联网科技股份有限公司成立于2010年,致力为行业客户提供软硬件结合的5G+工业互联网平台解决方案,通过设备物联、机器人乘梯、设备售后管理系统、电梯物联网等产品和服务,助力电梯及特种设备、医疗设备、机器人、环保设备、环卫设备、电力设备和水务设备等工业客户进行后市场服务的数字化转型,降本增效,开启利润增长的第二曲线。