中国信息通信研究院人工智能研究所人工智能关键技术和应用评测工业和信息化部重点实验室2024年9月 版权声明 本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,编者将追究其相关法律责任。 更名声明 原“集智”蓝皮报告更名为“集智”专题报告。“集智”专题报告将聚焦于特定领域或主题的深入探讨,提供更为专业和集中的内容分析。 前言 近年来,大模型技术能力不断创出新高,产业应用持续走深向实,显著加快人工智能通用化、实用化、普惠化发展进程。大模型兼具理论研究和产业应用双重价值,已成为当前科技前瞻布局和创新研发的焦点,受到国际社会高度关注。系统梳理大模型应用落地的共性需求和关键要素,给出现状诊断、能力建设、应用部署、运营管理等落地路线作为参考,将进一步促进大模型赋能千行百业,为打造新质生产力和推进新型工业化开辟新路径。 本报告重点梳理了大模型应用落地遵循的诊断、建设、应用、管理四个重要阶段,归纳总结出能力分析、需求挖掘、方案设计、研发测试、应用开发、效能评估、运维监测、运营管理八个关键步骤。基于需求拉动、问题驱动、创新推动原则,研究分析在每一步骤中基础设施层、数据资源层、算法模型层、应用服务层、安全可信层应重点关注的发展要素和亟待解决的核心问题。现状诊断阶段,通过分析大模型技术能力、梳理大模型应用场景、评估大模型发展基础,帮助应用方明晰业务发展和转型需求。能力建设阶段,设计契合应用方战略规划和业务需求的大模型建设方案,通过系统性研发和测试手段筑牢大模型技术底座。应用部署阶段,给出专用大模型优化部署和智能应用定制开发等参考模式,并构建出覆盖大模型设计开发、定制优化、部署运营等全生命周期的应用效能评估体系。运营管理阶段,面向大模型平台和服务给出运维监测和运营管理的参考模式,给出实时监测、动态追踪和预警机制等具体方法,指出 建立健全大模型运营管理体系的原则和要点。 未来,大模型有望持续为新一轮人工智能阶跃式发展注入强大动能,进一步助力人工智能实现技术能力不断融合创新、应用场景持续纵深拓展、产业生态加速转型升级、治理体系趋于完善稳健。本研究报告对大模型应用落地的研究和理解还有待加强,报告中如有不足之处,还请各方专家读者不吝指正。 目录 一、大模型发展情况概述............................................................................................1(一)全面提升多模态感知能力,推进认知智能走深向实.............................2(二)大模型场景落地百花齐放,擘画智能应用生态蓝图.............................5(三)技术选型与工程实践掣肘,亟需开展落地路线研究.............................7二、诊断大模型能力基础............................................................................................9(一)评估大模型能力发展现状,深入挖掘业务转型需求.............................9(二)梳理人财物要素就绪情况,系统评估人工智能基础...........................10(三)挖掘各类软硬件资源需求,统筹规划业务发展目标...........................12三、筑牢大模型技术底座..........................................................................................15(一)剖析大模型关键落地路线,科学确立技术选型原则...........................15(二)设计大模型智能系统架构,制定科学有效解决方案...........................16(三)系统研发大模型技术底座,全面开展功能性能测试...........................20四、革新大模型应用范式..........................................................................................24(一)参照业务场景个性化需求,定制化调优专用大模型...........................24(二)开发大模型原生智能应用,实现大小模型协同赋能...........................25(三)构建全链路效能评估体系,形成诊建用评有效闭环...........................30五、构建大模型管理体系..........................................................................................33(一)梳理国内外模型治理要点,明晰运营管理体系价值...........................33(二)实时监测大模型运行过程,确保高效稳定提供服务...........................34(三)建立健全大模型管理体系,保障业务高效稳定开展...........................37六、大模型发展趋势展望..........................................................................................40(一)探索大模型架构优化方案,带动技术应用双重涌现...........................40(二)紧抓行业数字化转型机遇,全方位打造新质生产力...........................42(三)加强引导大模型可信发展,对齐人类偏好及价值观...........................43 图 目 录 图1大模型底层技术支撑人工智能发展....................................................................2图2大模型的多维感知能力和认知能力....................................................................4图3大模型行业应用图谱............................................................................................6图4大模型应用场景....................................................................................................7图5应用方能力基础就绪度等级表..........................................................................10图6大模型发展能力就绪度评估指标体系..............................................................12图7需求分析的关键要素..........................................................................................15图8大模型建设方案设计的关键要素......................................................................20图9百度智能云千帆大模型平台..............................................................................24图10讯飞星火认知大模型云服务平台....................................................................30图11大模型应用成熟度评估体系............................................................................ 33 表 目 录 表1模型生态主要选型方案......................................................................................18表2模型优化主要选型方案......................................................................................18表3模型部署主要选型方案......................................................................................18表4模型规模主要选型方案......................................................................................18表5 AI Agent能力及特点.......................................................................................... 27 一、大模型发展情况概述 大模型是指具有大规模参数和复杂结构的深度神经网络模型,通常在训练过程中高度依赖海量的数据资源和强大的计算能力。近年来,算力水平的飞跃、数据规模的激增、算法能力的突破为大模型的长足发展提供了坚实的技术基础。大模型技术能力的持续优化和升级、应用场景的不断丰富和细化,以及各行业实现智改数转的需求日益高涨,共同促使大模型的应用市场呈现出欣欣向荣的发展态势。 大模型技术能力的突破得益于算力设施、数据资源、计算模式、网络架构等方面的源头创新。算力设施上,智能计算集群的快速发展为大模型的算力需求提供了坚实的基础保障。为满足万亿参数大模型的计算需求,NVIDIA发布了超强人工智能加速卡Blackwell GB200,通过芯片间的互连技术实现计算能力的代际飞跃。该芯片相较于H100,在大模型训练性能上提升3倍1,在推理速度上提升30倍,显著降低了训练推理的成本和能耗。数据资源上,大规模、高质量、多类型的数据集蕴含着丰富的语义知识,有助于提高大模型的技术能力,充分释放出大模型在不同场景下的应用价值。计算模式上,通过分布式并行、混合精度计算2等方法实现训练加速,通过模型压缩和蒸馏、低精度推理3等方法实现推理加速,可有效提升计算资源的利用率。为加速大模型的训练过程,百度飞桨推出4D混合并行策略,通过模型并行、参数切片并行、流水线并行和数据并行等方式可支持训练千 亿级稠密参数模型,相比其他3D混合并行策略至少提速23.7%。网络架构上,以Transformer为代表的主流架构不断迭代增强,进一步提升大模型的数据建模和泛化能力,不断突破大模型在长序列任务上的瓶颈。例如,在Transformer解码器的基础上融入混合专家模型可以有效提升大模型的性能表现4。基于Mega架构改进的Megalodon能够处理无限上下文,有效提高了大模型在长上下文上的训练推理的质量和效率。 在上述底层技术的有力支撑下,大模型的技术能力不断提升,在“听、说、看”等感知领域已接近或超越了人类水平,在理解、思考和创造等认知领域已取