AI智能总结
百度资深研发工程师 个人简介 百度资深研发工程师,文心快码(Baidu Comate)业务落地负责人,云端开发平台(iCoding)的技术负责人。 百度一级专利发明人,名下国内外发明专利10余个,已获授权 国家重点研发计划『基于人机结对编程与协同进化的智能敏捷开发云平台』技术骨干 百度工程效能部李杨 目录 01AI编码助手的行业发展 02新一代编码工具能力及实现 03领域案例及应用场景 04人机协同新范式 AI编码助手的行业发展——从低谷到狂热 AI助力研发提效初显 百度AI代码生成占比33%Google AI代码生成占比25%亚马逊编码速度提高57% AI编码助手的行业发展——技术发展的必然 技术突破:ScalingLaws是通往AGI的银弹 参数规模决定模型下限,千亿参数的GPT 3.5模型是“奇点”,带来质变训练数据质量和规模决定模型上限,代码数据相对于任何自然语言都是质量最高的“文本”,有极强的规律可循因此,大模型首先在“编程”领域发起了变革 文心快码训练数据提取方式,极其规范化的高质量数据 产品突破:GitHub找到了一种绝佳的交互方式 在IDE中通过幽灵字符向开发者展示预测结果,使用Tab采纳,N秒后自动消失未改变任何开发流程,极其丝滑的将AI能力嵌入到开发者的习惯 企业提效的必然(以百度研效工具发展轨迹为例) 企业提效的必然——单兵作战 ü流程是是实践后的经验、教训等总结,一定是『滞后的』ü如,针对Prompt、数据集等在工程团队如何管理,目前没有明确的范式 核心原因在于整个提效的设计不是站在开发者个人,而是站在组织上 ü面对花样繁多的项目管理流程,多数开发者更想聚焦于研发ü过度在团队内推广研发流程,反而引起开发者的抗拒心理,大幅降低开发者的幸福感 开发者的『iPhone』时刻 GithubCopilot+ChatGPT的诞生,吹响了『开发者个人提效』的号角,几乎一夜之间所有组织都开始关注 大模型催生了开发者个人提效的『银弹』 智能研发助手=代码自动补全(Completions)+理解私域知识(RAG)+独立分析需求(Agent) 文心快码-构建人机协同新范式 n文心快码(BaiduComate)是基于文心大模型,结合百度积累多年的编程现场大数据和外部优秀开源数据,打造的新一代编码辅助工具。拥有代码智能、场景丰富、创造价值、广泛应用等多重产品优势,可实现“帮你想、帮你写、帮你改”的场景应用形态。提升编码效率,释放“十倍”软件生产力。 目前百度内部“文心快码”智能代码助手整体采纳率达到了46%,新增代码中生成的比例已经达到了33% 文心快码-实现思路 智能体时代六大智能体 Web端(百度搜索、星河社区等)+IDE端(目录区、编辑区、Console区等) 框架层Agent+开放平台 知识层代码类(代码片段、代码依赖等)+文本类(技术文档、API文档等) 模型层推理调度+代码生成+代码续写+Embedding 文心快码-知识层 文心快码-智能体 智能体时代:委托自主完成任务 文心快码-智能体 全库架构梳理 业务逻辑梳理 网络检索分析 全库架构梳理 业务逻辑梳理 网络检索分析 场景介绍-技术调研 全库架构梳理 业务逻辑梳理 网络检索分析 获取最新的解决方案,摆脱模型内部压缩数据不是实时的限制。 实践案例——AI Native 智能粘贴 智能采纳 问题修复 实践案例——AI Native 智能粘贴 智能采纳 问题修复 实践案例——AI Native 智能粘贴 智能采纳 问题修复 实践案例——企业知识增强生成 激活企业私域文档,减少开发过程中的代码幻觉。 产品需求文档 测试用例文档 服务部署文档 实践案例——智能体 全栈编程智能体 安全智能体 单测智能体 实践案例——智能体 第二:修改项目 全栈编程智能体 安全智能体 单测智能体 实践案例——智能体 第三:美化项目 全栈编程智能体 安全智能体 单测智能体 实践案例——智能体 全栈编程智能体 安全智能体 单测智能体 实践案例——智能体 全栈编程智能体 安全智能体 单测智能体 应用效果 国内最大的落地规模 百度每新增100行代码,就有33行是AI生成。 国内各项评测第一 在信通院、软件协会、沙利文等权威机构评测业内领先。 覆盖国内千行百业 覆盖金融证券、消费娱乐、机械制造、电子商务等行业。 插件市场评分第一 在VSCode、JetBrains等插件市场评分第一。 未来规划-人机协同新模式 AI编码助手不会取代程序员 Ø自然语言不会成为编程的唯一语言,软件开发的复杂性和持续迭代的特质决定了它需要专门的人才把控,而不是任何一个不懂编程的人。Ø编程最好的编程方式不是自然语言,而是“妥妥拽拽”,比如要设计网站,最简单的办法不是告诉AI想要什么,而是直接拖动、绘制页面,给它展示应该怎么做,因此Design To Code将是未来的方向。 智能体是承载AI编码的下一个趋势 Ø智能体将托管一切可重复执行的任务,将极大解放开发者在“重复、琐碎、低密度信息收集”等维度的工作投入ØDevin提供了一种很好的交互形态,但面向程序员的AI助手应是高质量、低延时的 不局限于IDE,所有研发流程都将渗透 ØAI将在需求设计、任务拆解、编码、测试、部署等各个DevOps节点成为加速器,推动效率提高。Ø百度内已经在探索Figma To Code、API智能生成、自动化测试用例生成、流水线AI卡位、云原生环境AI运维等场景 感谢聆听