您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [腾讯]:大模型时代的金融研发重塑 - 发现报告

大模型时代的金融研发重塑

2026-06-09 腾讯 大表哥
报告封面

-从敏捷开发到Agent驱动的智能实践 曹骏腾讯云商业银行解决方案总经理 在⾦融领域的探索 腾讯的⼯程实践 实施路径建议 AICoding的驱动⼒ 软件研发被公认为⼤模型(LLM)最完美的落地场景之⼀ 2025Context Engineering ⼤模型正在重塑软件研发流程 2026Harness Engineering 2024Prompt Engineering 第⼆代:增强层·关注点:信息流治理·核⼼动作:RAG、多Agent协同·解决痛点:解决“信息不⾜”的问题 第⼀代:基础层·关注点:模型输⼊·核⼼动作:优化提⽰词技巧(CoT,Few-Shot)·解决痛点:解决“说不清楚”的问题 第三代:系统层·关注点:系统环境治理·核⼼动作:反馈回路、环境感知、⾃主门禁·解决痛点:解决“不可靠/不可控”的问题 上下⽂窗⼝⾜够⼤:2M+推理能⼒接近AGI⼯具使⽤成熟 上下⽂窗⼝增长:128K→1Mtokens指令遵循能⼒提升推理能⼒接近⼈类 上下⽂窗⼝极⼩:128Ktokens指令遵循能⼒差推理能⼒有限 驾驭⼯程(HarnessEngineering)是⼤模型研发体系运转的关键 系统定义 马具类⽐(TheHarnessMetaphor)底层的LLM模型犹如⼀匹蛮⼒⼗⾜的野马,拥有巨⼤潜⼒但⽅向难以预测。Harness(马具/马缰)则是为这匹野马打造的缰绳、鞍具和驾驶系统。通过马具,我们不改变马的⽣物特性,但能引导它的⼒量,使其成为可控的⽣产⼒⼯具。 HarnessEngineering是指围绕AIAgent设计约束机制、反馈回路、以及⼯作流控制的系统⼯程。它不只是PromptTuning,⽽是⼀套让AI稳定产出正确结果的⼯程系统。 嵌套结构:从指令到系统⼯程·Harness层:如何运⾏(控制流/约束/反馈)·Context层:给什么(知识/历史/记忆)·Prompt层:具体指令 ⾼效性通过⼯作流控制和反馈回路,减少冗余消耗,提升产出⽐ 可预测性消除⽣成式AI的“幻觉”随机性,让业务结果具备⼯程化确定性 稳定性确保Agent始终在预设的架构轨道内运⾏,不偏离任务⽬标 基于AI的研发⽅法在⾦融机构⾥的典型场景 现有应⽤的逆向⼯程 AICoding助⼒研发全流程量化提效 AI赋能软件开发⽣命周期,实现各环节效率的指数级跃升 编码(采纳率)30%-75%AI⽣成有效代码采纳率平均达到54%有效覆盖500⼈研发团队 技术⽅案设计1-3x⾃动⽣成系统架构(分层设计、接⼝定义、依赖关系、风险缓解)多路sub-agent代码探索和隐形需求挖掘⾃动拆解任务,构建需求覆盖矩阵 代码评审10x代码评审1天→1-2⼩时⾃动发现缺陷与规范问题⾃动发现安全漏洞和风险 测试⽤例编写与执⾏10xE2E⾃动化测试三维度验证(完整性、正确性、⼀致性)单元测试2-3天→2⼩时内AI单元测试覆盖率超90% 需求分析3-5x基于存量代码⽣成项⽬⽂档⽀持多模态需求⽂档解析构建me2AI/AI2AI双Spec体系需求沉淀和澄清更⾼效 基于⼤模型的AI研发实施路径建议 闭环⾃治 基础筑底期 链路贯通 关键⽬标:流程贯通,质量门禁完备 关键⽬标:闭环⾃治,可持续优化 关键⽬标:标准落地,知识就绪 ·编排研发流程:串联需求、⽅案、编码、测试、发布全流程·集成研发⼯具:打通需求、代码、⽂档、流⽔线·建设评审门禁:建⽴多级门禁·沉淀执⾏技能:封装⽅案、编码、测试、发布等标准Skill·回写过程状态:⾃动同步进度、结果和结论 ·建设多Agent协同:由各阶段Agent协同交付·实现卡点回退:评审未过、测试失败、发布异常⾃动打回修复·打通运⾏治理:接⼊⽇志、监控、告警与缺陷数据·建⽴度量体系:跟踪覆盖率、采纳率、通过率和交付时长·推⼴试点复制:先试点验证,再向更多⾏内系统推⼴ ·统⼀需求模板:标准化需求输⼊,⽀撑评审、澄清和AI理解·构建业务知识库:沉淀业务规则与术语·构建代码知识库:沉淀系统结构与关键实现·制定⼯程规则:固化安全、数据、⽇志、发布等研发红线·模板化技术⽅案:沉淀结构、接⼝、数据模板