AI智能总结
2025年中国生成式AI最佳实践 ——Agentic AI下的任务重构、决策与创新 生成式AI、Agentic AI、场景化、任务导向 报告说明———— 沙利文联合头豹研究院谨此发布中国生成式AI系列报告之《2025年中国生成式AI行业最佳应用实践》。本报告旨在梳理生成式AI技术发展动向,明晰各行业对于生成式AI的需求,并基于完整的评选指标与流程,筛选出各行业的生成式AI最佳应用实践。———— 沙利文联合头豹研究院对AI基础设施行业进行了下游用户体验调查。受访者主要来自基建、金融、医疗健康、互联网等行业。 本市场报告提供的生成式AI在各行业的发展现状亦反映出生成式AI的整体发展动向。报告最终对最佳应用实践的评选判断基于各厂商向沙利文提报案例,且仅适用于本年度中国生成式AI应用案例发展周期。 本报告所有图、表、文字中的数据均源自弗若斯特沙利文咨询(中国)及头豹研究院调查,数据均采用四舍五入,小数计一位。———— 报告提供的任何内容(包括但不限于数据、文字、图表、图像等)均系弗若斯特沙利文及头豹研究院独有的高度机密性文件(在报告中另行标明出处者除外)。未经弗若斯特沙利文及头豹研究院事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,弗若斯特沙利文及头豹研究院保留采取法律措施、追究相关人员责任的权利。弗若斯特沙利文及头豹研究院开展的所有商业活动均使用“弗若斯特沙利文”、“沙利文”、“头豹研究院”或“头豹”的商号、商标,弗若斯特沙利文及头豹研究院无任何前述名称之外的其他分支机构,也未授权或聘用其他任何第三方代表弗若斯特沙利文或头豹研究院开展商业活动。 研究框架(1/2) 生成式AI趋势洞察 •技术优化与成本降低----------•Agentic AI创造新价值----------•合成数据推动大模型迭代与落地----------•AI安全治理体系持续完善---------- 生成式AI海外优质案例分析 •生成式AI海外优质案例评价维度分析•Google Cloud×Seven-Eleven Japan•亚马逊云科技×Deye•亚马逊云科技×TVCMALL•Azure AI Foundry×ASOS•Azure×Sage Freight 生成式AI最佳实践案例评选流程及维度解析 •最佳案例评选流程与方法•最佳案例评选维度解析•最佳案例2025重点维度解析 中国生成式AI行业最佳应用实践方案 •生成式AI行业应用实践情况分析•生成式AI功能投入分析•中国生成式AI行业最佳应用实践图谱•交通基建行业的场景需求与挑战•交通基建行业最佳应用实践•金融行业的场景需求与挑战•金融行业最佳应用实践 研究框架(2/2) ----------36----------37----------41----------42----------46----------47----------51----------52----------56----------57----------61----------62 •汽车行业的场景需求与挑战 •汽车行业最佳应用实践 •能源与工业行业的场景需求与挑战 •能源与工业行业最佳应用实践 •娱乐行业的场景需求与挑战 •娱乐行业最佳应用实践 •企业服务行业的场景需求与挑战 •企业服务行业最佳应用实践 •互联网行业的场景需求与挑战 •互联网行业最佳应用实践 章节一生成式AI趋势洞察 技术优化与成本降低Agentic AI创造新价值合成数据推动大模型迭代与落地AI安全治理体系持续完善 1.1生成式AI技术优化与成本降低 得益于人工智能研究的持续火热,人工智能论文发表总量持续增长,人工智能在严苛比较基准测试中的性能持续提升,并且实现特定性能水平的推理成本已显著下降。 2013年至2023年间,人工智能相关论文发表的总数翻了一番多,从2013年的约10.2万篇增至2023年的超过24.2万篇。过去一年间的增长率达19.7%,这一增幅具有重要意义。计算机科学的众多领域,从硬件与软件工程到人机交互,如今均对生成式AI的发展都有所贡献。因此,观测到的增长现象反映出该人工智能更广泛且日益增强的关注度。 2023年,研究人员推出了MMMU、GPQA和SWE-bench等一系列新型比较基准,旨在测试前沿人工智能系统的极限。仅一年后,性能就大幅提升:MMMU、GPQA和SWE-bench的得分分别提高了18.8%、48.9%和67.3%。除这些比较基准,人工智能系统在生成高质量视频方面也取得了重大进展,在某些特定场景下,基于语言模型的智能体在时间受限的编程任务中甚至表现优于人类。 当前人工智能变得更加高效、经济和易用。依托小型模型能力跃升,执行GPT-3.5级别的系统的推理成本在2022年11月至2024年10月间骤降280多倍。硬件层面,年化成本降幅达30%,能效年提升率达40%。同时各个厂商的模型API调用价格也持续下降,截止目前,常规模型的API输出价格已经达到10元人民币每百万Tokens以下甚至更低。 1.2Agentic AI创造新价值 尽管生成式AI(GenAI)本身已经极大地提升了内容生成的效率和质量,但Agentic AI作为其更高级的形态,通过引入自主性、目标导向和多步骤执行能力,在生成式AI的基础上创造了全新的、更深层次的价值。 什么是AgenticAI? Agentic AI又称代理型AI,将大量宝贵的数据、能力和程序与自主系统相结合。与传统的生成式AI不同,后者被动地处理输入以产生固定的输出,代理型AI更像是一个合作者,它在业务环境中积极地朝着某个目标努力,而不仅仅是遵循指令。 这种协作能力使组织及其员工能够具备前所未有的效率和创造力水平,同时确保与组织目标保持一致。通过具备推理、感知环境、学习和适应的能力,智能体可以被赋予一个目标,然后独立执行复杂任务并解决问题以实现该目标,无需人类干预。 生成式AI进化革命 Chatbot Agentic AI Digital assistant 随着深度学习和大规模语言模型的发展,生成式AI进化为数字助理(DigitalAssistant),能够理解自然语言、执行多步骤任务,并与多种服务集成。 早期的生成式AI主要以聊天机器人(Chatbot)的形式出现,其核心功能是基于预设规则或简单的机器学习模型,对用户输入的文本进行响应。 具备代理(Agent)特性的AI系统,能够自主设定目标、规划路径、采取行动、评估结果并迭代优化,而不仅仅是响应指令。 为什么AgenticAI是生成式AI的下一个阶段? 1.3合成数据推动大模型迭代与落地 人工智能系统在算法上取得实质性改进的主要驱动力之一,是在越来越大的数据集上扩展模型及其训练。然而,随着互联网训练数据的日益枯竭,人们越来越担心这种扩展方法的可持续性以及数据瓶颈的可能性,使用合成数据如世界模型生成的数据来训练模型也被认为是解决潜在数据短缺的一种方案。 什么是世界模型? 世界模型(World Models, WMs)作为一种生成式AI模型,能够通过构建内部表征理解真实世界的动态规律(涵盖物理特性与空间属性),同时借助文本、图像、视频和运动数据等输入信息生成视频内容。通过从感官数据中学习表征和预测运动、力和空间关系等动态特性,实现对现实环境物理属性的理解并通过生成环境及动作,从而模拟、指导及实施决策。 合成数据特点及发展趋势 随着合成数据的普及,特别是人工智能生成的网络内容所占比例越来越大,未来的模型将不可避免地在非人类生成的材料上进行训练。虽然合成数据具有近乎无限供应的优势,但要有效地利用合成数据进行模型训练,还需要深入了解其对学习动态和学习效果的影响。数据集扩展的一种方法是数据增强,即通过修改真实数据(如图像倾斜或混合)在保留关键特征的前提下创造新的变化。合成数据生成和数据增强都为增强人工智能模型提供了机会。 自动驾驶与机器人仿真:在真实世界中收集极端或危险场景(如车祸、行人突然闯入)的数据既困难又危险。 科学模拟及研究:在科学研究和工程领域,通过跨尺度的推演,合成数据帮助科学家和工程师更好地理解和掌控复杂系统。 游戏与VR:用于构建虚拟环境的逻辑与物理规则,使玩家能与动态场景互动。通过世界模型,系统可模拟重力、碰撞、光照等真实效果,提升沉浸感。 1.4 AI安全治理体系持续完善 AI安全风险不仅仅存在于理论分析,并且真实的存在于现今各种AI应用中,,AI系统在设计上面临五大安全挑战:软硬件的安全、数据完整性、模型保密性、模型鲁棒性、数据隐私,其中模型与数据的可解释性贯穿始终,保证AI应用安全。 可解释数据与前馈检测:输入数据需要具备可解释性,并在进入模型前经过前馈检测,以发现潜在的恶意或异常数据,防止攻击样本混入可解释模型与可验证模型:AI模型本身不仅要具备较好的可解释性和健壮性,还需要通过验证机制来保障模型不会因对抗样本、后门攻击或数据污染而产生错误判断后馈检测与业务反馈:在模型推理完成后,系统通过后馈检测机制再次验证输出结果的合理性,确保输出不会对业务系统造成风险。如果检测到异常,可以通过熔断、冗余等手段进行安全回退业务系统集成:最终,AI推理结果才会被导入到业务系统中。通过这一整套架构,AI治理体系能在“数据—模型—业务”的全链路上实现安全保障 章节二生成式AI海外优质案例分析 生成式AI海外优质案例评价维度分析生成式AI海外优质案例分析 2.1生成式AI海外优质案例评价维度分析 效率提升度 •海外优秀生成式AI应用实践:亚马逊云科技与法拉利(Ferrari)合作,法拉利将其作为首选云服务商,利用其生成式AI技术实现多维度创新,有效实现客户个性化,并提高生产效率 创新性 •应用亚马逊云科技生成式AI:辅助赛车及赛道设计、分析比赛策略、驱动粉丝互动 章节三生成式AI最佳实践案例评选流程及维度解析 最佳案例评选流程与方法最佳案例评选维度解析最佳案例2025重点维度解析 3.1最佳案例评选流程与方法 最佳案例评选流程为厂商报名参与、案例输入、案例评估以及最后的案例交付与发布。案例评选将结合行业交叉大数据与沙利文创新的全维度评选指标,客观公正地呈现生成式AI行业的最佳案例。 方法论 沙利文融合了传统与创新的研究方法论,结合行业交叉大数据,通过多元化的调研方法与创新的全维度评估指标,客观公正地呈现生成式AI行业的最佳案例。 3.2最佳案例评选维度解析 最佳案例评选维度围绕生成式AI最新发展趋势,结合功能价值与适用性、技术性能与创新、实施与支持以及客户体验与满意度反馈四个维度全面评估不同行业各模块的案例服务能力。 功能价值与适用性维度 •需求适配性:关注产品是否能精准匹配用户的业务需求和场景逻辑,评估在目标达成、收益实现、代价考量及战略对齐方面的表现,以确保其适应并解决市场需求。•核心功能完整性:关注产品是否具备完整的核心功能模块,包括自然语言处理、图像生成、语音交互等核心模块协同性及成熟度,以满足实际业务闭环。•场景功能泛化性:衡量产品在不同应用场景中的适应性和扩展能力,以实现跨业务场景的无缝适配,泛华能力决定了技术的复用价值与长期持续性,是衡量系统扩展性的关键指标。 技术性能与创新维度 •多模态融合能力:关注产品能否高效处理文本、图像、音视频等多模态数据,并实现跨模态内容生成能力,该能力是实现复杂场景智能化的核心支撑。•生成内容稳定性与鲁棒性:关注系统在不同输入条件下输出内容的一致性与可靠性,关注在异常输入(如模糊指令、噪声数据)下的容错能力,确保生成结果始终符合预期,同时也关注生成质量提升方案•生成内容的合规安全:聚焦内容生成过程中的法律、伦理与数据安全风险,关注模型合规情况,自动化监测及合规保障措施,同时也关注在异常场景下的容错能力和应急响应制度 实施与