AI智能总结
出品机构:甲子光年智库报告指导:宋涛报告撰写:刘瑶发布时间:2023.08 前言 •伴随着ChatGPT的爆红,AIGC产业链受到广泛关注,大模型的发展正推动AI算力市场进入新的发展阶段,强大的AIGC算力基础设施正在构建当中。大模型训练是复杂系统工程,AIGC产业的算力也对应是系统化的建设,基于此,甲子光年智库特此展开AIGC的算力研究,输出《中国AIGC产业算力发展报告》,在瞬息万变的AIGC产业发展过程中,试图捕捉到AIGC产业算力的发展变化。 AIGC时代已来,算力作为推动产业发展的关键资源,决定了产业的发展速度及 本次报告探讨的问题 •明晰概念:从需求出发,探究决定AIGC产业基础设施(infrastructure)——算力,包括哪些关键决定因素?•产业分析:AIGC的算力产业链剖析,从芯片发展到云服务方案,”云边端“算力供应商的角色作用是什么?•需求探讨:中国AIGC产业发展是否缺乏算力,还是缺乏针对企业的“高性价比”及“可落地”的AIGC算力解决方案?•实践指南:针对当下国内的“百模大战”与企业对于AIGC应用落地的需求,目前AI算力领域有哪些解决路径及方案?•趋势可能:AIGC的算力爆发是否可持续?未来对AIGC的算力提出哪些层面的要求? AI算力不止于训练,同时支持AI多场景应用,在多细分场景上具有潜力 AIGC的爆发会重新改变负载AI技术的算力发展 AI技术(算法、模型)与算力的融合催生更多产品及服务模式 甲子光年重点关注企业——AIGC产业算力领域的领航者 “基于大模型自身实践与服务客户的专业经验,浪潮信息发布大模型智算软件栈OGAI(Open GenAI Infra)‘元脑生智’,OGAI以大模型为核心技术的生成式AI开发与应用场景,提供从集群系统环境部署到算力调度保障和大模型开发管理的全栈全流程的软件,从而降低大模型算力系统的使用门槛、优化大模型的研发效率,保障大模型的生产与应用。” “应用产生数据、数据训练算法、算法定义芯片、芯片赋能应用”是云天励飞一直坚持的人工智能发展之路。基于此,云天励飞构建了业界领先的算法、芯片、大数据全栈式AI能力,同时拥有大量创新应用和落地场景,横跨人工智能基础层、技术层和应用层。” “UCloud优刻得是中立、安全的云厂商,拥有超10年的公有云技术沉淀并积累了全面的系统工程能力,具备从数据中心、计算平台,到管理平台、网络服务、应用服务、生态接口等一站式产品和解决方案。凭借技术及工程能力沉淀,UCloud优刻得可在AIGC领域构筑强大的算力底座,通过优化网络和存储带宽提升大模型训练效率,并持续提供快速、高效、可控及安全的AI推理环境。” “凭借存储与计算物理融合的架构优势,存内计算能够为神经网络模型指数级增长的算力需求提供强大基石。知存科技凭借率先量产商用存内计算芯片的产业积累,将继续推进存内计算架构创新,由3D存内计算架构向高速互联存内计算架构演进,实现产品“端-边-云”侧算力全面覆盖。” “BoCloud博云形成了系列产品以创新云技术支撑企业核心业务,构建数字化高效IT系统。公司自主研发的多项软件产品,包括边缘计算平台、企业级容器平台、统一云管平台、虚拟化产品等,已在金融、电力、石油、政务、IDC、航空等行业领域的生产系统中落地实施,为国有电力公司、股份制银行、大型支付机构等标杆行业客户的重要生产系统提供服务。” “亿铸科技在全球率先利用ReRAM(RRAM)的特性着手使用先进异构封装的方式来实现系统级的芯片优化方案,并且在2023年3月,亿铸科技正式公布了存算一体超异构芯片的创新理念——以存算一体(CIM)AI加速计算单元为核心,同时将不同的计算单元进行异构集成,以实现更大的AI算力以及更高的能效比,同时提供更为通用的软件生态,开创大模型时代的AI算力发展新方向。 Part01产业基石,算力是AIGC产业的催化剂 目录 Part 02软硬兼得,AI新世代呼唤工程化导向的算力支撑 Part03层见叠出,商业浪潮下的算力选择思考 Part 04实践真知,AIGC产业算力实践的新范式 Part05来日正长,AI技术的翻涌带来无限可能 AI的新时代,生成式AI技术重新塑造AI技术的开发及应用 •随着2023年大模型的热潮,AIGC早已超越内容生产的概念,而突出生成式AI(Generative AI)的概念,即如何通过生成式AI的技术思路解决以往决策式AI难以完成的问题,尤其在数据或者内容生成上实现“质的突破”。 AIGC•新的AI时代则是AIGC产业全面进击的时代,随着生成式对抗网络(Generative Adversarial Network,GAN)等的演进及迭代,生成式AI可以延展到流程、策略、代码、蛋白质结构等多种形式,即意味着凡是可以使用数字内容形式的产业,生成式AI均可以涉及。 AI的新时代:更关注如何利用生成式AI技术在涉及数字内容的诸多领域实现改变及突破,生成式AI实际上扩大了“内容”的含义,凡是可以数字化的内容形式均为生成对象,而非传统意义下媒体环境的内容。 AIGC产业:新一代AI技术和理念,以“生成式AI”为代表技术的开发及应用产业,即如何利用资源发挥新的AI技术的应用,通过商业价值推动AI第三次浪潮的发展。 纵观AI发展,算法的发展及迭代极大地拉动了算力的需求 •机器学习的训练计算大概可以分为三个时期,2015-2016年左右开启了大模型时代,整体的训练计算量较之前的时期大2到3个数量级。 •从2022年底,随着ChatGPT成功带来大规模参数通用大模型相继发布。这些大模型的训练需要千亿、甚至万亿级参数,以及上千GB的高质量数据,大模型的训练迭代将极大地拉动了智能算力的需求。 深度学习时期之前,训练计算算力需求缓慢增长,算力翻倍需要21.3个月 深度学习不断取得进展,算力翻倍仅需要5.7个月,所需算力量级由TFLOPs增至EFLOPs 2015年开始逐渐出现大规模(更大参数量)模型,算力需求直接提升约两个数量级。 深究AI开发,“量变”的算法、数据可以带来“质变” 资源“三剑客”中,算力承接算法及数据,成为AIGC产业发展基石 •在现代人工智能领域,算力扮演着推动创新、实现突破的核心驱动力。算力、算法、数据和系统架构等多个方面的综合优化对于大规模模型训练的成功至关重要。从技术层面看,在大模型的研发过程中,预训练、微调和模型推理等环节是核心关键因素和主要计算特征。 AIGC的突破依赖于算力的“暴力美学”,应用依赖于算力在场景中的释放 •AI技术在实际应用中包括两个环节:训练(Training)和推理(Inference),AIGC的算力需要考虑训练及推理两个方面。•训练是指通过数据开发出AI模型,使其能够满足相应的需求,一般为AI技术的研发。因此参数量的升级对算力的需求影响大。•推理是指利用训练好的模型进行计算,利用输入的数据获得正确结论的过程,一般为AI技术的应用。推理部署的算力主要在于每个应用场景日数据的吞吐量。 AIGC算力具备软硬件的复杂性,并且以不同产品/服务/方案为应用赋能 AIGC产业的算力是工程化结果,是从芯片到资源服务的多层次构造 •未来大模型的产业化发展是一套复杂的系统工程,构建高效稳定的算力平台是核心要义,成熟的算法、数据产业链,配套工具链及丰富的生态链是关键因素,亟需以系统的方式寻找最优解。•算力设备软硬件兼容性和性能调教上的Know-How,可以保证AI算力的适配性和稳定性,并非单一因素的参数能简单决定。 Transformer结构解锁新AI时代的iPhone时刻,实现资源及应用的飞轮增长 •Transformer的应用标志着基础模型时代的开始(基础模型的庞大规模和应用范围突飞猛进),模型参数量指数级增长,带动算力超过摩尔定律,可以称为AI技术的iPhone时刻。•技术层面上,基础模型通过迁移学习(Transfer Learning)和规模(scale)得以实现;深度学习中,预训练又是迁移学习的主要方法:在替代任务上训练模型(通常只是达到目的的一种手段),然后通过微调来适应感兴趣的下游任务。迁移学习(Transfer Learning)使基础模型成为可能。 数字经济时代,人工智能相关产业必然迎来广阔发展,AI算力正当时 •企业数字化转型推动人工智能领域支出,人工智能支出已经成为支持企业数字化转型支出的主力之一。IDC数据统计,全球范围内,企业在包括硬件、软件和服务在内的人工智能(AI)市场的技术投资从2019年的612亿美元增长至2021年的924亿美元,预计将在2022年(同比)增长26.6%至1170亿美元,有望到2025年突破2000亿美元,增幅高于企业数字化转型支出整体增幅。 •从国家到地方,关注通用人工智能的系统建设,探索通用人工智能新路径,推动创新场景应用成为思想共识、政策共识、发展共识。 提出系统构建大模型等通用人工智能技术体系,开展大模型创新算法及关键技术研究,加强大模型训练数据采集及治理工具研发,建设大模型评测开放服务平台,构建大模型基础软硬件体系,发展面向通用人工智能的基础理论体系。 同时北京正在加快推进国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区建设,打造具有全球影响力的人工智能创新策源地 •北京市经信局联合市科委中关村管委会、市发改委等共同发布「北京市通用人工智能产业创新伙伴计划」,旨在搭建人工智能大模型的开放合作平台,建立协同合作机制,通过持续优化产业链布局,大幅提升优质算力、高质量数据供给支撑能力,培养一批应用大模型技术实现突破性成长的标杆企业。 模型的训练及推理离不开智能算力,AI应用催生智能算力需求 •通用大模型、垂直行业大模型的训练及微调,及基于大模型推理的行业应用需要大量的AI算力实现支撑。AI渗透千行百业,拉动智能算力规模高速增长。2022年,各行各业的AI应用渗透度都呈不断加深的态势,尤其是在金融、电信、制造以及医疗领域。 多地重视人工智能及算力产业发展,相继出台相关政策 产业趋势叠加时代趋势,专用智能走向通用智能 •产业角度:大模型的产业发展仍处于起跑阶段,相关技术的行业应用和场景化落地存在无限可能。IDC预测,到2026年,全球AI计算市场规模将增长到346.6亿美元,生成式AI计算占比从2022年4.2%增长到31.7%。•时代趋势:随着LLM大规模语言模型技术的不断突破,以ChatGPT为代表的生成式人工智能引发广泛关注,人工智能正在从专用智能迈向以大模型为基座的通用智能,逐渐走向“开领域,走向通用”。 逻辑能力迭代升级 千亿级别具备涌现能力和泛化能力的通用大模型,涌现能力是指隐含知识和推理归纳,带来创新灵感的出现;泛化能力是为多任务泛化提供统一强大的算法支撑。基于泛化能力及涌现能力的人工智能已经能够拥有人的逻辑理解能力、使用工具能力、像人一样可以跨领域工作,是通用人工智能的跨时代能力价值。 通用智能迎来曙光 大模型的逻辑推理能力得益于其强大的表示能力和学习能力。大模型可以学习到更多的特征和规律,从而更好地表示输入数据。同时,大模型可以通过更多的数据和更复杂的训练方式进行训练,从而提高其学习能力和泛化能力。这些优势使得大模型在逻辑推理能力方面具有极大的潜力。 Part 01产业基石,算力是AIGC产业的催化剂 目录 Part 02软硬兼得,AI新世代呼唤工程化导向的算力支撑 Part03层见叠出,商业浪潮下的算力选择思考 Part 04实践真知,AIGC产业算力实践的新范式 Part05来日正长,AI技术的翻涌带来无限可能 MaaS是AI新时代云服务模式的破与立,构建新的“算力+算法”服务模式 •MaaS(Model as a service)模型即服务,是指将大模型作为一项服务提供给用户使用的新业态,MaaS中模型训练(主要指微调)及推理的技术路线成立必须依赖云计算的算力支撑,同时算力及其他资源通过MaaS模型实现A