AI智能总结
作者全球可持续发展服务主管及全球资源行业实践主席stephanie jamison 全球领先—技术可持续发展创新尔 赋能可持续AI 2总经理—埃森哲研究马修·罗宾逊 沙拉布·库马尔·辛格首席总监— Accenture研究 全球创新领军者 全球领先—数据与人工智能Senthil Ramani 首席战略与创新官Bhaskar Ghosh 人工智能正在快速扩展,但代价是什么?我们的新分析介绍了可持续人工智能指数(SAIQ),这是一个衡量指标,追踪人工智能如何将金钱、能源和排放转化为可衡量的性能,使用代币作为标准化的绩效单位。它使企业能够根据其独特的组织优先事项平衡财务可行性、能源弹性和环境影响。基于专有模型和专家见解,我们确定了四个要点,以帮助领导者可持续地扩展人工智能:更智能的硅、更清洁的数据中心、更具战略性的人工智能使用和管理即代码。 我们相信那些会问“我们从投入到人工智能的资源中得到什么?”——并基于答案采取行动的公司,将定义未来。 赋能可持续AI 4为了帮助公司最大化其人工智能投资的回报——不仅在财务方面,还包括能源、水和环境影响——我们围绕四个要点制定了一个实用框架:部署更智能的硅、去碳化数据中心、审慎使用人工智能以及将可持续性融入人工智能治理。这些措施共同使企业能够在符合新指标的情况下可持续地扩展人工智能,在增长与环境保护和合规准备之间取得平衡。这一见解促使我们采取行动。我们联系了17位外部专家,包括来自计算机科学、人工智能和能源行业的学者、实践者和思想领袖。我们还汇集了来自安永可持续发展、技术创新、战略和数据与人工智能实践部门的专业人士。我们的目标是理解领导者应该采取哪些措施来确保长期绩效和韧性。一个关键成果是新的指标:可持续人工智能商数(SAIQ)。它衡量公司将投资——美元、能源、水——转化为宝贵人工智能成果的有效程度。这个指标不仅仅是一个基准。它是一个用于决策的战略视角。 我们从一个问题开始:我们是否以一种可持续的方式扩展人工智能?根据当前趋势,答案是否定的。推动人工智能革命的基础设施正在以堪比整个国家的速度消耗着前所未有的电力和水资源。人工智能不再是新兴趋势——它正在重塑从医疗诊断到零售供应链的一切。我们希望将对话基于事实。与其依赖人工智能能源和资源需求的零散估计,我们产生了自己关于人工智能能源消耗、碳排放和水资源利用的全球估计。目标:基于真实的基础设施数据、建模场景和可持续性影响指标,确定领导者现在需要了解的内容。随着人工智能的采用增长,支持大规模人工智能所需能源、排放和水的成本正以同样快的速度上升。如果放任不管,人工智能的环境足迹可能会威胁到企业的可持续发展目标,并超出我们地球的限度。但这不仅仅是可持续发展风险——它也是设计和创新的机会。解决这一问题可能是实现韧性和长期价值创造的途径。 人工智能效率悖论 到2030年,为人工智能提供动力的数据中心预计每年将消耗612太瓦时能量——相当于加拿大的全年总电力消耗量(图1)。2冷却这些数据中心可能需要消耗30.2亿立方米的新鲜水,这超过了挪威或瑞典等国家的年新鲜水总取用量。3人工智能不再仅仅是一个创新的前沿——它正迅速成为全球商业的支柱。根据埃森哲的AI规模发展领跑者指南那些热衷于利用生成式人工智能重塑自身的组织,预计在18个月内,通过在全企业范围内部署和扩展生成式人工智能后,生产力将提高13%,收入增长率将提高12%,客户体验将改善11%,成本将降低11%。1但它的发展付出了我们再也无法忽视的成本。支撑当今人工智能革命的设施正在消耗大量的电力和水资源,同时排放大量碳,造成的环境足迹正威胁要破坏人工智能本应带来的进步。 人工智能的碳排放可能占全球总排放量的3.4%—十年内增长了11倍。如果不受控制,这一趋势不仅会损害地球。它还会推高成本,加剧供应链压力,并使企业面临监管风险、碳税和利益相关者反弹。是时候将问题从“我们的AI有多强大?”重新定义为“我们为人工智能投入的资源能得到什么?”根据 Accenture 的目标净零排放报告显示,全球2000家最大公司中,只有16%的企业正在按计划实现其净零排放目标。4人工智能不断增长的能源足迹可能会进一步拉大差距,除非得到控制。然而,这里存在着悖论:虽然人工智能本身具有巨大潜力来减少大多数公司的碳足迹,但目前只有14%的公司使用人工智能来减少排放。这是时代的讽刺。同样,代表企业在效率、生产力和能力方面的代际飞跃的技术,可能会破坏商业目标。 赋能可持续发展AI 6预计到本世纪末,人工智能数据中心电力使用量将增长10倍以上,达到612太瓦时(TWh),相当于2022年加拿大的电力需求。 让我们算笔账我们需要一个新的智能衡量标准——一个不仅反映AI的强大程度,还反映其构建的智慧和运行的负责任程度的指标,一个不仅衡量AI计算负载(通常用“token”数量,即处理信息的基本单位来衡量),还衡量其在经济压力下的弹性和效率的指标。传统的效率衡量方法虽然有用,但无法全面反映情况。以电力使用效率(PUE)为例:它告诉我们在数据中心总能耗与IT设备能耗的相对基础上,数据中心的运行效率如何,但它并未说明这种效率衡量的是什么。它并非设计用来衡量人工智能模型将电力、美元、碳和水转化为智能、转化为影响的能力如何。它无法帮助企业回答这样的问题:对于我们投入的每一单位资源,我们得到了什么样的产出? 可持续人工智能商数:兆瓦时能量tCO em3水$tokentokentokentoken 为弥补这一差距,我们提出了可持续性调整智商(SAIQ),这是一种衡量人工智能系统将资金、电力、水和碳转化为实际性能效率的多维度指标。SAIQ是一个复合效率得分,用于衡量人工智能系统的环境和经济性能,计算公式为$/token、MWh/e/token和m³水/token的加权总和。随着时间的推移,token, tCO2一个组织的安全智能(SAIQ)可以通过衡量四个方面的效率来跟踪其人工智能的可持续性:成本、能源、碳排放和水资源使用。SAIQ越低,人工智能系统就越高效和负责任。该指标可以引入标准化的、数据驱动的方法来应对衡量人工智能相对于所用资源真实影响这一挑战。 2 传统指标(例如准确率、延迟)已无法全面反映AI的成本。诸如每美元、每兆瓦时、每吨二氧化碳当量以及每立方米水的多维度指标提供了更全面的视角——使利益相关者能够看到相对于其财务和环境成本,系统生产有价值输出的效率如何。– 米哈埃拉·范德·舒尔教授,机器学习、人工智能和医学教授,剑桥大学医学人工智能中心主任,剑桥大学教授 • 成本效益($/token):可行性、可负担性•碳和水效率(tCO e/个令牌)2m³水/令牌):可持续性,净零目标,立法组织可以通过调整权重(w1, w2, w3, w4)来适应其战略重点,从而最小化其 SAIQ,提升 AI 性能并最有效地应用,而不是将其作为一刀切的基准。例如,一个成本敏感的企业可能会强调 w1(每个 token 的美元),而一个以可持续性为中心的组织可能会更重视 w3(每个 token 的吨 e),从而实现灵活的协调对齐。二氧化碳2商业和ESG目标。•能源效率(兆瓦时/代币)韧性,供应安全如图2所示,SAIQ使组织能够在三个相互关联的维度上保持平衡:认识到人工智能的真实成本-输出比,仅仅是开始。随着其能源和资源需求的加速,组织必须将SAIQ透镜应用于人工智能堆栈的每一层——从硬件和基础设施到部署策略和治理。 人工智能的更广阔视角我们提供一种平衡增长与环保责任和商业绩效的方式,实现人工智能的规模化发展。四种行动——使用智能硅、去碳化数据中心、审慎部署人工智能并嵌入人工智能治理为代码——可以帮助领导者提高其组织在三个维度上的 SAIQ:财务(每个代币的美元)、能源(每个代币的瓦特)和立方米。环境(吨CO)2每token的水量)。SAIQ为组织在可持续地扩展AI方面的有效性提供了一个整体衡量标准,捕捉了下面推荐的四个相互依赖行动的相互影响,它们共同构成了一份将可持续性转化为AI战略可衡量成果的实用手册。每个行动都会以相互交织和增强的方式影响 SAIQ 指标的一个或多个组成部分,而非孤立地影响。例如,使用节能硅和芯片,模型和 IT 架构可以减少能源消耗,同时也能降低成本和碳排放。类似地,强大的 AI 治理可以减少模型浪费并提高利用率,同时也能改善成本和碳排放影响。 人工智能在全球能源消耗中的占比预计将从2024年的0.2%上升至2030年的1.9%,以48%的复合年均增长率(CAGR)呈现异常迅速的增长速度,超过该时期整体电力需求增长预期的1.5%。 赋能可持续人工智能 12优化GPU能效和数据中心利用率可以削减AI预计到2030年的能耗121万亿瓦时——相当于挪威的年用电量。实现这一潜力需要在更智能、计算效率更高的硬件和模型上运行人工智能工作负载,以降低成本、减少排放并减少对大型云数据中心的依赖,同时不损害人工智能能力。企业可以更进一步,将其未充分利用的人工智能计算资源货币化,以创建一个不仅减少浪费而且创造新的收入来源的更高效的人工智能生态系统。大多数AI模型运行在老旧硬件上,这些硬件从未打算用于当今内存密集型计算需求。结果:巨大的能源浪费、高昂的运营成本和高排放。这些低效率不仅仅是可持续性方面的担忧。在日益增长的地缘政治和供应链不确定性中,它们是商业风险。更智能的计算不仅是一种气候要求,也是对波动的对冲。 操作 1:Put smart硅工作 这里是一些需要关注的领域:在更智能的基础设施上运行 AI其他硬件设置,例如类脑计算,为更有效地处理数据提供了一种有前景的方式。人脑运行与神话的方法最大限度地减少了功耗和热问题,已被证明可以将边缘设备的AI推理功耗降低20倍。类似地,三星电子已开发出PIM技术,该技术将AI专用半导体集成到高带宽内存中。将部分数据计算工作从处理器卸载到内存,从而节省了85%的数据移动能量消耗。为了获得每兆瓦时的更多AI输出(“token”),应将AI工作负载转移到更有效地集成硬件和软件的架构上。计算存储(CIM)和处理存储(PIM)技术可以直接在数据存储处处理数据,从而大幅降低能耗。这最小化了内存和处理器之间昂贵的移动数据,这是传统系统中的关键瓶颈。例如,作为CIM领域的领导者,Mythic正通过将模拟计算与闪存集成,开创AI推理的转变。 在边缘部署AI赋能可持续人工智能 13这种实时分析提高了诊断速度并减少了延迟,同时还减少了数据传输量和相关能耗,从而改善了患者预后并使临床运营更可持续。在任何给定时间都处于活动状态。9使用fp8、moe和多词预测格式——允许模型一次性生成多个单词而不是一次生成一个单词——DeepSeek不仅降低了计算需求,还在技术查询和代码生成方面提供了有竞争力的性能。在边缘部署人工智能可以减少云的使用,并通过降低延迟来提高性能,同时减少碳排放。边缘人工智能应用特别适用于依赖实时数据处理行业的制造、医疗保健、零售和金融服务等。通用电气医疗与英特尔合作,将边缘人工智能集成到其医疗成像设备中。通过在设备上直接处理扫描,临床医生可以更快、更准确地检测如气胸等病症——而无需将大量成像数据发送到云端。10 难以置信的效率——使用大约 20 瓦的功率来执行一些估计相当于 1 尾算次(每秒一百亿亿次计算)。7相比之下,训练大型语言模型的单个处理单元可消耗超过400瓦特——而这项任务需要数千个此类单元。神经形态系统模拟人脑的神经结构和功能来处理信息,使用仅在活跃时才耗电脉冲神经网络(SNNs)。OpenAI近日签署了一封意向书,计划从初创公司Rain AI购买价值5100万美元的神经形态处理单元(NPUs),旨在与传统硬件相比显著节省能源。8要获得每美元更多的人工智能输出,请使用轻量级人工智能模型和低精度计算格式,如浮点8位(FP8)。通过仅使用8位,FP8减少了内存需求并允许更快的计算,使其成为快速训练和部署大型人工智能模型的理想选择。中国初创公司DeepSeek通过一种具有独特架构的大型语言