行业研究公司研究宏观策略财报招股书会议纪要稀土低空经济 DeepSeek AIGC 智能驾驶大模型

贝壳-贾琳-当我们用AI写了100万行代码

信息技术2024-08-212023第十二届全球TOP100软件案例研究峰会娱***

AI智能总结

AI编程发展现状与贝壳判断

AI编程，学界称为Program Synthesis，旨在自动化编码过程，生成满足用户意图的计算机程序。其目标不仅是提升专业程序员的开发效率，也让更多受众能参与编程。AI编程面临两大挑战：程序空间巨大，如何高效搜索目标程序；用户意图表达复杂，需通过形式化逻辑、输入输出示例或自然语言表达。

GPT带来的机遇与实证效果

大模型（Transformer）的序列预测能力强，成为当前最有效的程序搜索技术。GPT等大模型带来显著提效效果：

谷歌AlphaCode击败46%的参赛者
微软实验显示Copilot组效率提升55%
华为实践表明84%的重度使用者认为效率提升

贝壳AI研发助手CodeLink的设计理念与技术实践

贝壳CodeLink的设计理念是AutoComplete，通过对照实验验证AI开发组与传统开发组的效率差异。企业落地需关注工程化、规模化与收益，贝壳采用自研模型评测框架，优势包括：

针对特定任务和场景优化
保证数据安全与隐私
成本更低，数据可控

贝壳自研模型策略：

分而治之、小模型、适配模型的prompt工程
指令微调使Javascript Pass@1提升X%
LLM2Code加速框架基于CodeLlama-7B

CodeLink产品效果与更多环节融合AI

CodeLink产品效果显著，通过高频带低频、IDE入口、平台属性实现共创。CodeChat作为结对编程专家，解决写代码问题，多模架构、IDE深度绑定、指令集和上下文变量等功能提升效率。WorkBench私域工作台解决接口文档和联调部署测试痛点。

CodeLink Next与未来展望

超越编程，每个研发环节都值得用AI重新审视。大模型能力将植入更多研发流程，开发方式与全栈AI工程师协同方式将发生革命性变革。基础能力索引+Agent智能对接，从AI编码走向全面自动化的人机协同。

“⻉壳研发效能专家、基础产研平台架构师，深耕软件⾃动化提效领域，主导过⾯向企业的⽆代码/低代码开发平台、⼀站式产研协作平台、效能度量平台等⼤型研发提效类项⽬的落地。近期带领团队探索基于⼤模型的研发助⼿类产品研发，结合AI与软件⼯程技术，在⻉壳成功落地AI研发助⼿CodeLink。” 贾琳⻉壳找房摘要 1.AI编程的发展现状以及⻉壳对AI编程的判断2.⻉壳AI研发助⼿CodeLink的设计理念与技术实践3.在企业成功落地AI助⼿类产品的经验 AI编程的学界叫法：Program Synthesis Church A. Logic, arithmetic and automata. In: Proc. of the Int'1 Congess of Mathematicians. 1962.23-35.Zohar Manna and Richard J Waldinger, Toward automatic program synthesis. Communications of the ACM, 14(3):151–165. 1971Amir Pnueli and Roni Rosner. On the synthesis of a reactive module, the 16th Principles of programming languages, POPL, 1989Sumit Gulwani et al. Program synthesis. Foundations and Trends® in Programming Languages, 2017Erik Nijkamp et al. an open large language model for code with multi-turn program synthesishttps://arxiv.org/abs/2203.13474, 2022 The goal of program synthesis is toautomate the coding process,and generate a computer program that satisfies the user’s specified intent.//⾃动化编程过程，产⽣⼀个所表述意图的计算机程序 not only improve the productivity of experienced programmers but also make programming accessible to a wider audience//不仅提升专业程序员的开发效率，⽽且让更多受众也能编程 AI编程的两⼤挑战程序空间程序就是⼀个字符序列，所有字符的排列组合构成了⼀个巨⼤的程序空间如何在这么⼤的空间中找到⽬标程序？程序搜索技术是核⼼。⼤模型(Transformer)的序列预测能⼒很强，是⽬前最有效的程序搜索技术⽤户意图如何表达⽤户的意图？形式化的逻辑描述（可能⽐写代码还难）、输⼊输出例⼦（Excel）、⾃然语⾔（需要交互）⽤⾃然语⾔表达意图，给程序员⽤的AI：GPT带来的机遇⼤模型真的能带来提效吗⾕歌的实验（2021底）：AlphaCode参加了DeepMind编程竞赛平台Codeforces上的10次实时⽐赛，它击败了46%的参赛者；微软的实验（2022.9）：编程实验，Copilot组71分钟，普通组161分钟，提升55%，且Copilot组完成度更⾼华为的实践（2023.4）：编程竞赛前200名进⾏调查，84%的重度使⽤，前10名全部⽤。去年第1名没有⽤，排名100+了，88%的⼈认为可以提升效率。 55%的⼯作，CodeLink都能帮到你 CodeLink设计理念 AutoComplete《AI编程实验室》⼯程师招募，共160⼈分为4场对照实验，分析实验结果采⽤分层抽样的⽅法进⾏分组 ①准备⼯作：开发环境、需求设计、测试⽤例②现场讲解与答疑、问卷收集③实验结果分析 ①AI开发组：要求使⽤CodeLink去完成需求 ①提供产品使⽤⼿册等供AI组进⾏学习，包含安装、使⽤⽅法、技巧等多⽅⾯ ②传统开发组：要求在不使⽤AI⼯具的情况下去完成需求 AutoComplete落地实践企业落地的视⻆⼯程化、规模化、产⽣收益，不仅看数据，更关注⽤户视⻆的效果 ①看数据- >⾃建评测框架 ②有验证- >对照实验，最终⽤户视⻆的效果 ③坚决地投⼊- >⾃研CodeLink、⼤模型的起步⻉壳模型评测框架⻉壳代码⽣成⼤模型⾃研模型的优势 ①可以针对特定任务、特定场景优化②保证公司数据安全&隐私③模型稳定后成本较购买API更低④⾼⾃由度，避免/绕过限制⑤数据可控、模型可控便于公司持续改进⾃有模型策略:分⽽治之、⼩模型、适配模型的prompt⼯程指令微调 Javascript上Pass@1达成X%+，较基座提升X%，⽣产环境采纳率X% ⻉壳LLM2Code加速框架 GPU: V100S-PCIE-32G，Model: CodeLlama-7B 更多环节融合AI的能⼒ CodeChat结对编程专家和AutoComplete⼀起解决写代码的问题 ①多模架构：把最好的模型拿给⼤家⽤ ②根据打开的窗⼝，总结代码上下⽂，提出代码建议 ③IDE深度绑定，直接在编辑器流程中讨论特定的代码⾏ ④引⼊指令集和上下⽂变量，与私域知识打通技术问答代码解释错误堆栈分析接⼝⽂档痛在哪？ WorkBench私域⼯作台联调部署测试痛在哪 WorkBench私域⼯作台模型+⼯程+产品⼀体化建设 CodeLink产品效果 more idea，more fun，more efficient 共创的⼟壤：⾼频带低频、IDE的⼊⼝、平台属性 CodeLink Next 超越编程，每个环节都值得⽤AI重新审视⼀遍⼤模型能⼒植⼊到更多研发流程开发⽅式的变⾰更多全栈AI⼯程师协同⽅式的变⾰基础能⼒索引+Agent智能对接从AI编码⾛向全⾯⾃动化的⼈机协同

点击免费查看完整报告