行业研究公司研究宏观策略财报招股书会议纪要 seedance2.0 低空经济 DeepSeek AIGC 大模型

智能研发的点与面：蚂蚁代码大模型落地实践

信息技术2024-12-05肖斌-罗***

AI智能总结

研报总结

01 研发提效探索

CodeFuse在蚂蚁研发全生命周期提效的探索：通过代码大模型和蚂蚁大模型发展路线，实现研发平台智能化。
大模型的能力演进：人类只需设定目标、提供资源、设置流程和监督结果，通过SOP方式编排多领域Agent完成复杂任务。
大模型背景下效能平台产品演进：
- 传统效能平台：通过程序和工具满足用户明确功能需求。
- AINative效能平台：集成AI能力，通过侧边栏进行知识库问答或AI调度。
- 效能平台+Copilot：结合平台能力进行智能化改造，实现生成式、总结类和推理类任务。
- 工具化平台：传统方式满足用户功能需求。
- 智能化平台：AI嵌入用户操作，简化复杂任务。
- AI原生平台：AI能力嵌入每个操作，实现自主任务处理。

02 智能研发发展路线

蚂蚁智能研发发展路线：
- Copilot+Chat模式：在现有产品功能上做智能化升级，如自然语言生成用例、代码补齐测试用例等。
- Copilot+Agent模式：以领域Agent为核心，增加超级会话及Agent调度与执行能力。
- AINative模式：AI原生，用户无需主动触发AI功能，任何原有功能都能嵌入AI能力。

03 关键技术与难点

CodeFuse研发助手关键技术以及难点突破：
- 工程关键技术与难点：
  - 触发时机优化：以代码补全为例，优化高频场景触发时机。
  - 模型幻觉问题：模型“虚假认知”导致生成代码编译错误。
    - 基于上下文感知学习(ICL )能力，解决模型幻觉问题：
      - 结合RAG+程序分析能力强化上下文，通过相似度检索和AST解析找到相关代码。
      - 测试集EM提升：40.9%→59.75%。
      - Context-Aware扩展边界意义：利用仓库内多文件代码补全，关注整体依赖关系。
    - 基于Block-FIM能力，解决代码生成不完整问题：
      - Block-FIM效果展示：结合程序分析技术构建Block数据，模型生成完整Block停止。
      - 解决大模型自回归训练不支持代码补全的问题。

04 未来方向思考

未来软件研发领域发展方向思考：
- 人工智能应用阶段：技术普惠，AI让技术更加人性化，不是替代研发人员，而是让更多人成为研发专家。
- 大模型正在重新定义软件。

演讲人：肖斌目录 02智能研发发展路线 01研发提效探索 04未来方案思考 03关键技术与难点 01研发提效探索 CodeFuse在蚂蚁研发全生命周期提效的探索代码大模型探索蚂蚁大模型发展路线大模型的能力演进人类仅需设定目标，提供资源，设置流程，监督结果。通过SOP方式根据特定流程编排多领域Agent，完成特定复杂任务或跨平台任务。集成平台知识库或平台特定数据对模型进行加训，通过对话方式提供研发平台知识问答。 Chat模式单纯问答形式无法满足智能化需求，需要结合平台的能力进行智能化改造，集成研发平台能力（工具）供AI调度。大模型背景下效能平台产品演进传统效能平台 AINative效能平台效能平台+Copilot 工具化平台智能化平台 AI原生平台通过效能平台Copilot完成AI能力的使用，用户一般通过侧边栏进行平台知识库问答或直接通过AI调度效能平台能力。通过程序，工具等传统方式满足用户各种明确且特定的功能。用户一般在产品上通过界面和特定操作流程完成任务。以AI技术为核心，能够自主进行复杂的任务处理和决策。AI能力嵌入到用户每个操作中，通常能通过更简单的操作完成更复杂的事情。 02智能研发发展路线蚂蚁智能研发发展路线 Copilot+Chat模式传统效能平台快速集成AI能力在现有产品功能上做智能化升级是AI应用的重要方式。一些适合的场景： 1.生成式，如自然语言生成用例、根据变更代码补齐测试用例等； 2.总结类，如对PR标题和描述的总结、基于文档的总结与问答； 3.推理类，如代码冲突解决、问题的诊断与修复、异常日志分析等； Copilot+Agent模式传统效能平台工具与AI能力升入结合单纯问答形式无法满足智能化需求，需要结合平台的能力进行智能化改造。以领域Agent为核心，对效能平台进行全面升级，增加超级会话及Agent调度与执行能力 AINative模式 AI原生：用户无需主动触发AI功能，任何原有功能都能友好嵌入AI能力至用户操作中。 03关键技术与难点 CodeFuse研发助手关键技术以及难点突破工程关键技术与难点如何对高频场景进行触发时机优化（代码补全为例）什么是模型幻觉问题模型“虚假认知” 由于无法感知SortUtils中bubbleSort方法，所以模型根据有限的上下文猜测了可能的insertionSort方法，并生成对应调用代码，导致生成代码的编译错误。基于上下文感知学习(ICL )能力，解决模型幻觉问题基于上下文感知学习(ICL )能力，解决模型幻觉问题结合RAG+程序分析能力强化上下文。感知本地仓库中预处理构建的文本库/向量库做相似度检索寻找相似代码。通过AST解析，引用链路等追踪手段，找到对应相关代码并压缩测试集EM：40.9%->59.75% 基于上下文感知学习(ICL )能力，解决模型幻觉问题 Context-Aware扩展边界的意义 •仓库内多文件代码补全•70%的代码编写会用到仓库内其他文件信息•更加关注仓库整体依赖关系•更加关注与目标代码相似的代码段 •单文件代码补全•无法利用仓库内其他文件信息•仅能完成30%的场景•补全不准，出现严重的幻觉基于上下文感知学习(ICL )能力，解决模型幻觉问题基于Block-FIM能力，解决代码生成不完整问题 Block-FIM效果展示 •Motivation •大模型自回归训练，仅适合Chat任务，不支持代码补全。•代码补全需要根据代码的上下文预测代码缺失部分，此模式无法结合上下文进行完型填空。 •FIM（Fillinthemiddle） •将训练的文本序列一部分移动到结尾，自回归重新排序进行训练。•Character：字符粒度随机切分样本，生成结果无法保证语法准确性，工程需要复杂后处理保证预发准确性。 •Block-FIM •Block：结合程序分析技术构建Block数据，将样本进行Block粒度切，模型生成完整Block停止。 04未来方向思考未来软件研发领域发展方向思考人工智能应用阶段技术普惠 AI让技术更加人性化：AI不是替代我们研发人员，是让更多人成为我们 THANKS 大模型正在重新定义软件Large Language Model Is RedefiningThe Software

点击免费查看完整报告