- 从敏捷开发到Agent 驱动的智能实践 曹骏腾讯云商业银行解决方案总经理 在⾦融领域的探索 腾讯的⼯程实践 实施路径建议 AICoding 的驱动⼒ 软件研发被公认为⼤模型(LLM)最完美的落地场景之⼀ 2025Context Engineering ⼤模型正在重塑软件研发流程 2026Harness Engineering 2024Prompt Engineering 第⼆代:增强层· 关注点:信息流治理· 核⼼动作:RAG、多Agent 协同· 解决痛点:解决“信息不⾜”的问题 第⼀代:基础层· 关注点:模型输⼊· 核⼼动作:优化提⽰词技巧(CoT, Few-Shot)· 解决痛点:解决“说不清楚”的问题 第三代:系统层· 关注点:系统环境治理· 核⼼动作:反馈回路、环境感知、⾃主门禁· 解决痛点:解决“不可靠/不可控”的问题 上下⽂窗⼝⾜够⼤:2M+推理能⼒接近AGI⼯具使⽤成熟 上下⽂窗⼝增长:128K→1M tokens指令遵循能⼒提升推理能⼒接近⼈类 上下⽂窗⼝极⼩:128K tokens指令遵循能⼒差推理能⼒有限 驾驭⼯程(Harness Engineering)是⼤模型研发体系运转的关键 系统定义 马具类⽐(The Harness Metaphor)底层的LLM 模型犹如⼀匹蛮⼒⼗⾜的野马,拥有巨⼤潜⼒但⽅向难以预测。Harness (马具/马缰) 则是为这匹野马打造的缰绳、鞍具和驾驶系统。通过马具,我们不改变马的⽣物特性,但能引导它的⼒量,使其成为可控的⽣产⼒⼯具。 Harness Engineering 是指围绕AI Agent 设计约束机制、反馈回路、以及⼯作流控制的系统⼯程。它不只是Prompt Tuning,⽽是⼀套让AI 稳定产出正确结果的⼯程系统。 嵌套结构:从指令到系统⼯程· Harness 层:如何运⾏(控制流/约束/反馈)· Context 层:给什么(知识/历史/记忆)· Prompt 层:具体指令 ⾼效性通过⼯作流控制和反馈回路,减少冗余消耗,提升产出⽐ 可预测性消除⽣成式AI 的“幻觉”随机性,让业务结果具备⼯程化确定性 稳定性确保Agent 始终在预设的架构轨道内运⾏,不偏离任务⽬标 基于AI的研发⽅法在⾦融机构⾥的典型场景 现有应⽤的逆向⼯程 AI Coding 助⼒研发全流程量化提效 AI 赋能软件开发⽣命周期,实现各环节效率的指数级跃升 编码(采纳率)30%-75%AI⽣成有效代码采纳率平均达到54%有效覆盖500⼈研发团队 技术⽅案设计1-3x⾃动⽣成系统架构(分层设计、接⼝定义、依赖关系、风险缓解)多路sub-agent代码探索和隐形需求挖掘⾃动拆解任务,构建需求覆盖矩阵 代码评审10x代码评审1 天→ 1-2 ⼩时⾃动发现缺陷与规范问题⾃动发现安全漏洞和风险 测试⽤例编写与执⾏10xE2E⾃动化测试三维度验证(完整性、正确性、⼀致性)单元测试2-3天→ 2⼩时内AI 单元测试覆盖率超90% 需求分析3-5x基于存量代码⽣成项⽬⽂档⽀持多模态需求⽂档解析构建me2AI/AI2AI双Spec体系需求沉淀和澄清更⾼效 基于⼤模型的 AI 研发实施路径建议 闭环⾃治 基础筑底期 链路贯通 关键⽬标:流程贯通,质量门禁完备 关键⽬标:闭环⾃治,可持续优化 关键⽬标:标准落地,知识就绪 · 编排研发流程:串联需求、⽅案、编码、测试、发布全流程· 集成研发⼯具:打通需求、代码、⽂档、流⽔线· 建设评审门禁:建⽴多级门禁· 沉淀执⾏技能:封装⽅案、编码、测试、发布等标准Skill· 回写过程状态:⾃动同步进度、结果和结论 · 建设多Agent 协同:由各阶段Agent 协同交付· 实现卡点回退:评审未过、测试失败、发布异常⾃动打回修复· 打通运⾏治理:接⼊⽇志、监控、告警与缺陷数据· 建⽴度量体系:跟踪覆盖率、采纳率、通过率和交付时长· 推⼴试点复制:先试点验证,再向更多⾏内系统推⼴ · 统⼀需求模板:标准化需求输⼊,⽀撑评审、澄清和AI 理解· 构建业务知识库:沉淀业务规则与术语· 构建代码知识库:沉淀系统结构与关键实现· 制定⼯程规则:固化安全、数据、⽇志、发布等研发红线· 模板化技术⽅案:沉淀结构、接⼝、数据模板