
CONTENTS /目录 热门演讲实录|落地和进化 当代码遇上大模型:智能编程助手的架构设计与工程实践打破AI辅助开发碎片化困境,阿里巴巴R2C Agent的AI编程实践重构开发体验:CodeFuse智能代码助手的设计与实践游戏研发中的AI转型:网易多Agent系统与知识工程实践抛弃“级联”架构!快手OneRec用大模型重构推荐系统,服务成本降至1/10AI原生应用全栈可观测实践:以DeepSeek对话机器人为例从模型到智能体:Snowflake的企业级Agentic AI工程化之路 原创访谈| Interview 颠覆传统认知!顶尖架构师眼中,决定职业生涯上限的不是技术能力|独家对话一线架构大佬Christian Ciceri 所有知识型岗都要被AI“吞了!清华大学教授刘嘉:未来大学分化猛烈,软件公司靠“几人+Agent”就够 AI产品能不能火,全看创始人会不会当“网红”?这届AI大佬不拼代码了,个个都是隐藏的社交媒体达人 10年经验,不敌AI 10秒?对话5位顶尖架构师:AI不会替代我们,但会淘汰旧的我们 从OpenAI回国的90后姚班博导,打造了国内首个开源Agent训练框架:从OpenAI团队解散与重组,看智能体技术十年沉淀 工具图谱|大模型时代的编程工具 半年研发、1周上线,1秒200行代码爆发?美团研发负责人:靠小团队奇袭,模型和工程能力突破是核心 Claude封锁中国,腾讯带着国产AI编程工具CodeBuddy来了 从烧光现金、裁掉一半员工,到ARR 9个月破亿:Replit用“全栈平台”反杀Cursor,赌赢“每层都赚钱”模式 Claude Code唯一对手!?AI编程黑马AmpCode崛起的秘密:不设token上限,放手让AI自己死磕代码 挑战Claude code和Cursor:阿里Qoder对标全球,AI编程迎来“上下文”革命 氛围编程行不通!CTO们集体炮轰AI编程:不是失业,而是失控 架构变革|大模型时代的软件技术栈 Python只是前戏,JVM才是正餐!Eclipse开源新方案,在K8s上不换栈搞定Agent LangChain彻底重写:从开源副业到独角兽,一次“核心迁移”干到12.5亿估值 将AI带入数据!Oracle给数据库内嵌上Agent框架 弃Python拥抱JVM,Spring之父20年后再造“革命性框架”:我从未如此确信一个新项目的必要性 “比Flink更适合Agent!”十五年老中间件转型做Agentic AI:比LangChain快70%,还能省2/3算力 还在拼命加GPU?AI应用规模化的下半场,拼的是这五大软件“新基建” Fluss湖流一体:Lakehouse架构实时化演进 高性能全闪并行文件系统的设计和实践 语言新秩序|大模型时代的编程语言 AI时代,编程语言选型更难也更重要:Go、Rust、Python、TypeScript谁该上场?Python新版本去GIL刷屏,Karpathy点赞敢死队,Python之父:冷静,别神话并发Cloudflare用Rust重写核心系统:CDN性能提升25%,响应时间缩短10毫秒Cloudflare酿六年最惨宕机:一行Rust代码,全球一半流量瘫痪!ChatGPT、Claude集体失联 架构师2025年第二季 本期主编Tina反馈feedback@geekbang.com流程编辑丁晓昀商务合作hezuo@geekbang.org发行人霍泰稳内容合作editors@geekbang.com 卷首语 过去几年,软件行业的叙事悄然改变。招聘市场从“前端遍地”变成“全栈为王”,AI正在吞噬样例代码、CRUD页面与重复性业务逻辑。那个毕业两三年、训练营转行就能拿到高薪的时代,确实一去不返。 但软件行业并不是唯一的“受害者”。老师在重新设计作业,分析师在适应AI总结报告,摄影师被智能相机和生成式图像重塑,连牙医、兽医诊所都在被资本流程化。几乎每一个行业,都在经历由技术、资本与叙事共同推动的剧烈重构。工程师只不过站在这场变革的第一排。因此,一个问题比以往任何时候都更重要:当写代码不再是核心壁垒,工程师的价值究竟是什么? 过去,熟练掌握框架和API、能快速出活的工程师可以稳定工作多年;但今天,这些能力正快速被AI和模板化方案覆盖。真正难以替代的,是能在混乱中抽象问题、在不确定中设计可演进系统、能把技术决策与业务目标对齐,并在系统失效时带着团队把它救回的人。 这不仅是架构师的挑战,也是所有工程师面临的新现实。 与此同时,AI重写了招聘方式与成长路径:简历可以自动生成,面试题可以提前演练。真正拉开差距的,是你如何使用工具解决真实问题:如何规划系统、如何用AI验证设计、如何做权衡,以及如何把自己的实践沉淀到GitHub、技术博客和社区里,让作品自己说话。 运气固然存在,但软件行业有一个从未改变的规律:越是持续把自己暴露在真实问题和真实用户面前的人,越显得“幸运”。他们靠的不仅是天赋,而是在一次次“做出 来、丢出去”的实践中,被反馈校正、被复杂性逼着成长。 这本电子书不会告诉你如何规避风险,也不会提供所谓的“安全路径”。它想讨论的是:在每个行业都在被重写的当下,工程师如何重新理解自己的价值,并在不确定中找到确定性。 如果你开始意识到:“写好代码”已经不够,“守住现状”反而更危险,那么这里,就是你重新定义自己角色的起点。真正值得思考的问题不是“工程师会不会被AI替代”,而是:当软件行业的叙事改变,你准备靠什么能力继续写入下一章? 当代码遇上大模型:智能编程助手的架构设计与工程实践 演讲嘉宾段潇涵编辑Kitty 在人工智能快速发展的今天,大语言模型正在重塑软件开发的范式。从最初的代码补全工具,到基于Prompt的智能助手,再到具备自主规划与执行能力的Agent,我们正经历着开发模式的革命性转变。在InfoQ举办的QCon全球软件开发大会上,字节跳动豆包MarsCode/Trae IDE架构师段潇涵做了专题演讲“从指令到Agent:基于大语言模型构建智能编程助手”,他深入介绍了如何基于大语言模型构建新一代智能编程助手,分享了从概念到落地的完整实践经验。 内容亮点 在Agent技术架构方面,不同于传统的Prompt模板方案,将开发需求分解为具体 步骤,并在执行过程中进行自我反思和修正 •在上下文感知方面,构建代码知识图谱,实时构建代码的结构和依赖关系等,解决了大语言模型处理大型代码库时的上下文限制问题 以下是演讲实录(经InfoQ进行不改变原意的编辑整理)。 在人工智能快速发展的今天,大语言模型正在重塑软件开发的范式。从最初的代码补全工具,到基于Prompt的智能助手,再到具备自主规划与执行能力的Agent,我们正经历着开发模式的革命性转变。本次演讲深入探讨如何基于大语言模型构建新一代智能编程助手,分享从概念到落地的完整实践经验。 演讲首先剖析当前研发效率的痛点,展示传统开发工具的局限性,以及大语言模型为我们带来的新机遇。接着,详细介绍了智能编程助手的技术架构,包括Agent的核心设计理念、工程能力构建方法、以及与IDE的深度集成实践。通过实际案例的演示,我们展示智能助手如何在代码理解、生成、优化等场景中提供有效支持。 作为一线实践者,我们也会分享在工程落地过程中积累的经验与教训,包括架构选型、prompt优化、系统集成等关键决策点的思考。最后,我们展望智能编程助手的发展方向,探讨如何打造真正的智能研发伙伴。 编程助手解决的痛点 首先我们来回顾一下过往代码补全及代码生成的经验,以及在大语言模型时代,它能帮大家解决的一些痛点。我们可以看到代码智能编程助手的演进流程,大体可以分为两条线。 首先是代码补全这一条线。最早的时候,代码补全是基于语法规则的静态语法分析。现在,各家IDE(里肯定都有这样的功能。比如我们在写代码时,它会突然出现一个下拉框,列出当前类中可用的函数和变量,我们在编程中经常使用这种功能。第二个阶段是基于机器学习和统计数据分析的代码补全,它会更进一步,让我们感觉更有智能。比如曾经有一个插件叫TabNine,大家如果有用过应该有体会。它刚出来的时候非常惊艳。到了第三个阶段,也就是像Copilot这类工具出现的时候,大家会觉得大语言模型真的改变了这个时代。它能够理解代码意图,分析更多代码上下文,通过更广泛的上下文让代 架构师2025年第二季 码生成更符合逻辑、更加完整。它不再是一行代码片段的生成,而是会有更多上下文联动。比如现在大家常见的Tap键超级补全类的功能,它可以修改代码全文的引用。比如我改了一个函数的名字,所有调用的地方都可以通过一个Tab键全部修改掉。这个时代会让人感觉更惊艳。 再看代码生成这一条线,它也经历过几个时期。第一个时期是现在仍在使用的,比如在项目初始化时,基于某些模板或脚手架。它的优势在于各家公司可以自己定制流程,在特定场景下可以一键生成项目框架。但它的局限性在于灵活性非常受限,只能是硬编码的方式。第二个阶段是基于元信息生成代码的方案。简单解释一下什么是元信息生成:大家在前几年会经常看到类似于OpenAPI的平台。我们会声明好API的元信息,然后它可以自动帮你生成调用代码,甚至可以生成不同语言的调用代码。这在云厂商、PaaS厂商或SaaS厂商提供的SDK中比较常见。它的优势在于能够精确地支撑业务,比如云厂商提供SDK,过去多种语言的SDK都是完全手写编码,现在通过声明API,可以用各种语言的生成器,根据元信息生成多种语言的SDK,从而减少大量重复工作。不过它的劣势在于,更多依赖于元信息管理,比较复杂,而且生成逻辑需要根据不同的编程语言单独处理生成器。 到了大语言模型时代,代码生成变得更加自然。我们可以通过自然语言与大语言模型交互,要求它帮我们生成特定场景的代码。比如ChatGPT刚出来的时候,我自己感觉非常惊艳。我可以把需求以及可能已有的代码片段上下文贴到它的输入框里,它就能生成代码,而且代码质量相对来说是中等偏上。我们可以看到,代码智能的发展从最开始的简单补全,已经慢慢演化到现在可以与人协同交互,理解偏复杂场景,从代码片段补全到全流程支撑的状态。 在这个时代,研发人员可以从以下几个方面受益:一是提升研发效率。研发效率的提升不一定体现在时间缩短,也可能是心态或工作量上的提升。大量的重复性编码,尤其是业务上可能存在的面条型代码,都可以由大语言模型来实现。二是降低记忆负担。我自己比较常用这个功能。在做开源项目时,会用到很多开源库,而开源库的API如果不熟悉,就需要反复查阅文档。有了大语言模型,它的记忆能力比人类更强,我们可以直接利用它来补全这些API,更加便捷。三是跨越知识鸿沟。大家可能会有这种感受,有了大语言模型,我们的能力不再局限于原来定位的工作。比如我是客户端开发人员,也可以用大语言模型帮我写一些服务端代码;我是服务端开发人员,想自己写前端控制页面,也不用再依赖学习前端完善的基础知识,或者与前端同事配合。我可以利用AI生成一个虽然可能只有五六十分,但也能用的代码。 Agent技术架构与核心能力 Agent架构概览 接下来我将重点讲解一个Agent的形态,它的技术架构大概是什么样的,以及我们通过什么样的工程手段可以把大语言模型结合落地到我们的IDE中。首先,我们可以通过一张比较直观的图来展示,我们的技术架构大体分为四层。 首先,最直观的是用户界面(UI)如何与用户衔接。第二层是Agent的核心功能,其中有两个模块,连线非常多,说明这是比较核心的部分。一个模块是计划的执行,另一个是工具的调用。通过蓝色和红色框区分,计划执行时,模型会输出规划,同时搭配IDE提供的工具执行操作,例如文件的修改、查询等。再往下一层,是我们为了构建Agent架构体系所需要的基础能力。其中一个关键点是代码知识图谱(Code KnowledgeGraph)。大语言模型要理解项目信息,首先需要构建足够的信息,并以合适的结构和方式提供给模型。此