您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[-]:智能研发的点与面:蚂蚁代码大模型落地实践 - 发现报告

智能研发的点与面:蚂蚁代码大模型落地实践

信息技术2024-12-05肖斌-罗***
AI智能总结
查看更多
智能研发的点与面:蚂蚁代码大模型落地实践

演讲人:肖斌 目 录 02智能研发发展路线 01研发提效探索 04未来方案思考 03关键技术与难点 01研发提效探索 CodeFuse在蚂蚁研发全生命周期提效的探索 代码大模型探索 蚂蚁大模型发展路线 大模型的能力演进 人类仅需设定目标,提供资源,设置流程,监督结果。通过SOP方式根据特定流程编排多领域Agent,完成特定复杂任务或跨平台任务。 集成平台知识库或平台特定数据对模型进行加训,通过对话方式提供研发平台知识问答。 Chat模式 单纯问答形式无法满足智能化需求,需要结合平台的能力进行智能化改造,集成研发平台能力(工具)供AI调度。 大模型背景下效能平台产品演进 传统效能平台 AINative效能平台 效能平台+Copilot 工具化平台 智能化平台 AI原生平台 通过效能平台Copilot完成AI能力的使用,用户一般通过侧边栏进行平台知识库问答或直接通过AI调度效能平台能力。 通过程序,工具等传统方式满足用户各种明确且特定的功能。用户一般在产品上通过界面和特定操作流程完成任务。 以AI技术为核心,能够自主进行复杂的任务处理和决策。AI能力嵌入到用户每个操作中,通常能通过更简单的操作完成更复杂的事情。 02智能研发发展路线 蚂蚁智能研发发展路线 Copilot+Chat模式 传统效能平台快速集成AI能力 在现有产品功能上做智能化升级是AI应用的重要方式。一些适合的场景: 1.生成式,如自然语言生成用例、根据变更代码补齐测试用例等; 2.总结类,如对PR标题和描述的总结、基于文档的总结与问答; 3.推理类,如代码冲突解决、问题的诊断与修复、异常日志分析等; Copilot+Agent模式 传统效能平台工具与AI能力升入结合 单纯问答形式无法满足智能化需求,需要结合平台的能力进行智能化改造。 以领域Agent为核心,对效能平台进行全面升级,增加超级会话及Agent调度与执行能力 AINative模式 AI原生:用户无需主动触发AI功能,任何原有功能都能友好嵌入AI能力至用户操作中。 03关键技术与难点 CodeFuse研发助手关键技术以及难点突破 工程关键技术与难点 如何对高频场景进行触发时机优化(代码补全为例) 什么是模型幻觉问题 模型“虚假认知” 由于无法感知SortUtils中bubbleSort方法,所以模型根据有限的上下文猜测了可能的insertionSort方法,并生成对应调用代码,导致生成代码的编译错误。 基于上下文感知学习(ICL )能力,解决模型幻觉问题 基于上下文感知学习(ICL )能力,解决模型幻觉问题 结合RAG+程序分析能力强化上下文。 感知本地仓库中预处理构建的文本库/向量库做相似度检索寻找相似代码。通过AST解析,引用链路等追踪手段,找到对应相关代码并压缩 测试集EM:40.9%->59.75% 基于上下文感知学习(ICL )能力,解决模型幻觉问题 Context-Aware扩展边界的意义 •仓库内多文件代码补全•70%的代码编写会用到仓库内其他文件信息•更加关注仓库整体依赖关系•更加关注与目标代码相似的代码段 •单文件代码补全•无法利用仓库内其他文件信息•仅能完成30%的场景•补全不准,出现严重的幻觉 基于上下文感知学习(ICL )能力,解决模型幻觉问题 基于Block-FIM能力,解决代码生成不完整问题 Block-FIM效果展示 •Motivation •大模型自回归训练,仅适合Chat任务,不支持代码补全。•代码补全需要根据代码的上下文预测代码缺失部分,此模式无法结合上下文进行完型填空。 •FIM(Fillinthemiddle) •将训练的文本序列一部分移动到结尾,自回归重新排序进行训练。•Character:字符粒度随机切分样本,生成结果无法保证语法准确性,工程需要复杂后处理保证预发准确性。 •Block-FIM •Block:结合程序分析技术构建Block数据,将样本进行Block粒度切,模型生成完整Block停止。 04未来方向思考 未来软件研发领域发展方向思考 人工智能应用阶段 技术普惠 AI让技术更加人性化:AI不是替代我们研发人员,是让更多人成为我们 THANKS 大模型正在重新定义软件Large Language Model Is RedefiningThe Software