您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[极客传媒]:架构师2025年第一季:Agentic AI十年风口:软件生态正在重构 - 发现报告

架构师2025年第一季:Agentic AI十年风口:软件生态正在重构

AI智能总结
查看更多
架构师2025年第一季:Agentic AI十年风口:软件生态正在重构

CONTENTS /目录 特别专题| Agentic软件革命 传统数据仓库正在被Agentic AI吞噬?Agentic Data Stack初探 Agentic AI要终结数据库和SaaS?大厂掌门人公开互撕,焦虑的CEO们押上了不同的技术路线 被骂惨的“现象级”Manus,今天我们来扒一扒它的真实水平! GPT-4o“吉卜力”爆火,Prompt、SD白学了?!大模型能力进化碾压一切 资源有限,如何构建高效能的AI Agent Agent驱动的智能答疑产品构建:问答、诊断与修复实践 Andrej Karpathy爆火演讲刷屏技术圈:AI开启软件3.0,重写一切的时代来了! 访谈文章| Interview 吴恩达评Agent现状:MCP还欠火候,单Agent跑通已是“奇迹”,A2A协作堪称“双重奇迹” “我已经过时了”!83岁图灵奖大师、龙书作者在大模型时代的技术焦虑:越来越难以适应新技术 “不是Cursor不够强,是Claude Code太猛了”!创始人详解Claude Code如何改写编程方式 微软重磅开源Copilot!64岁VS Code创始人亲口承认:眼红Cursor,但真正价值在后端,它“抄”不过去! 年赚三亿美金、估值近百亿,Cursor竟无护城河? 月烧4万元,两工程师用Claude Code跑出15人团队效率:值不值全网吵翻了! 热门演讲实录|落地和进化 AI驱动的智能化单元测试生成:字节跳动的实践与创新去哪儿网前端代码自动生成技术实践AI创新应用C端B端商业化实践,从中国走向全球大模型赋能电商B端,快手电商技术实践深度揭秘Databricks × Snowflake纷纷下注,PostgreSQL成AI时代数据库标准?小红书鸿蒙OS下的性能优化探索与实践复杂场景下的RAG架构演进:跨模态知识联邦与统一语义推理实践揭秘千卡GPU集群如何高效训练多模态大模型:vivo AI团队实战经验分享 推荐文章| Article Java三十周年重磅发声:James Gosling狠批AI是“一场骗局”,是科技高管“压榨程序员的新利器” Redis之父:哪怕被喷我也得说,AI远远落后于人类程序员! “前端已死”是危言耸听吗? InfoQ 2025年趋势报告:软件架构和设计 AI将如何颠覆传统软件开发团队 架构师2025年第一季 本期主编Tina流程编辑丁晓昀发行人霍泰稳 反馈feedback@geekbang.com商务合作hezuo@geekbang.org内容合作editors@geekbang.com 卷首语 十年前,我们惊叹于AI能“补全代码”“补个文档”。而今天,Agentic AI已悄然改变了软件开发的整个生态,它不只是一个工具,更像是一个新物种——能理解业务、自动编写、持续演进的“数字工程师”。 这一波变革,比过去任何一次技术跃迁都更彻底。它深刻重塑了程序员的角色:写代码不再是核心能力,理解问题、设计解决方案、与智能体协同,成为新的竞争力。程序员正从以“活动”(如编码)为导向,转变为以“结果”(如解决问题)为导向,其核心职责是确保智能体伙伴交付的成果精准满足需求。 它也颠覆了企业的技术策略:决策焦点从“该不该买SaaS”转向了“能不能快速生成自己的软件”。购买SaaS意味着放弃知识产权、受制于供应商的更新节奏,定制需求常被搁置。而Agentic AI提供了新路径:自建软件不仅显著提速,更能灵活构建那关键的20%定制功能,精准契合业务需求。由于问题规模更小、开发周期更短、成本更低,且核心IP和创新节奏完全自主掌控,Agentic AI为曾受困于预算、资源、人才的中小企业,开辟了一条前所未有的数字化捷径。 这本关于“Agentic AI十年”的电子书,很快会让你发现,我们已走得比想象中更远:Agent能读懂你的老旧代码,能自己给出改造建议,甚至能写出文档解释“我为什么这么写”;它能遵守合规规则、复用已有代码、提醒你“这个方法在repo里早就有”;它不是黑盒,而是“有逻辑、有记忆、有判断力的开发伙伴”。我们也许还没完全适应,但变化早已不可逆转。 这不是一本预测未来的书,而是一本记录当下变化的书。十年,不只是一个技术周 期,更是一种承诺。Agentic AI带来的,不只是开发方式的变化,更是在推动整个数字世界加速进化。 未来已经到来,智能正在成长。欢迎翻开这本书,和我们一起见证一个全新生态的诞生。 传统数据仓库正在被Agentic AI吞噬?Agentic Data Stack初探 作者郭炜策划Tina 从技术架构的角度看,我认为这一次的AI浪潮将深刻影响整个软件生态。DSS系统的设计是以人作为最终消费者的决策支持逻辑为中心,然而,随着Agentic AI时代来临,最终的“消费者”更可能是Agent,对数据仓库和复杂ETL链路将被重新设计,甚至消失。传统数据仓库偏重结构与查询模式,会被Agentic Data Stack架构强调语义与响应模式取代。本文作者的原标题为《传统数据仓库正在被Agentic AI吞噬?AgenticData Stack初探》。 引言:Snowflake换CEO背后的信号 2024年春天,云数据仓库的明星公司Snowflake宣布换帅,前Google广告业务负责人Sridhar Ramaswamy接替了曾带领Snowflake实现600亿美元估值的传奇CEOFrank Slootman。 如果你只是把这当成一次高管轮换,理解就不够透彻,因为这背后真正的隐喻是,数据仓库世界的范式,正在悄然巨变。 “技术的演进,从来不是线性推进,而是技术的跃迁,从OLTP数据库到MPP数据仓库,从MPP本地化计算到向量化云数仓引擎,都是一个技术跃迁到另一个技术,从一个产品霸主到另一个产品霸主。” Slootman是“数据仓库黄金时代”的代表。他押注云原生、押注多租户架构、押注Snowflake成为新一代数据平台的中枢,直接在市场上干掉了我从业的第一家公司——当年的数据仓库霸主Teradata(从102亿美金市值到现在20亿美金市值)。就在他功成身退的这一刻,Snowflake官方博客的关键词悄然切换:AI-first、Agent-driven、语义导向的数据架构。 这不是巧合,这是风向。 同一时间,硅谷最具前瞻性的风投们正在押注“Agentic AI”这个新概念:AI不再只是一个模型,它是一个能感知、能行动、有目标、有协作能力的Agent。 那么问题来了: 当AI不再只是“聊天工具”,而是能主动感知业务变化、理解意图并执行操作的智能体时,传统数据仓库这样的为“人”建造的决策支持系统还可以满足Agent的需要么? 数据仓库曾是企业的“重要的数据资产”,如今,却可能沦为Agent的“数据素材库”。甚至连“素材”这个词都在贬值,因为Agentic DataStack可以直接访问原始数据,并以语义+数据的形式直接供给给上层各类Sales Agent,Risk Agent直接使用;而数据仓库里无语义、冗余的数据只能留给传统BI和数据开发人员来消费。 架构师2025年第一季 真正危险的不是被淘汰,而是你还在运行上一代范式的规则,而世界已经换了剧本。 这不是对数仓的轻视,而是历史的轮回。正如当年Hadoop、Iceberg的崛起重构了数据湖,今天,Agentic AI正在重写企业级的大数据架构。 1970-2024:数据仓库架构是如何演进的 1970:数据仓库之父:Bill Inmon 数据仓库之父Bill Inmon首次提出“面向主题、集成、时变、不可更新的数据集合”这一概念(EDW),奠定了后半个世纪企业数据架构的基石。 我本人也有幸在20多年前在北京大学的时候,在唐世谓教授带领下,学习并参与翻译《数据仓库》第一版,这本书里对主题域、数据分层架构和缓变维(历史拉链表)的描述,从上个世纪一直沿用到今天,成为整体数据仓库的奠基之作。 1983:Teradata诞生,MPP架构横空出世 1983年诞生了未来30年横扫所有企业数据仓库基础设施的公司Teradata,这也是我毕业后第一份工作所在的公司。首次将MPP(大规模并行处理)架构引入数据处理系统,Teradata凭借软硬一体的基于Bynet的MPP架构,在超大量级数据处理和复杂SQL的情况下,比Oracle、DB2效率高出数倍。第一次使用Teradata的时候我的惊喜不亚于后来我首次测试使用ClickHouse做宽表查询时的惊诧。 我加入Teradata的时候,他还是一个NCR旗下的部门,我名片logo是这样子的,想了解Teradata的同学可以看我这一篇文章《再见,我的数仓黄埔军校,Teradata正式退出中国!》。 1996:Kimball提出“雪花模型”,OLAP引擎出现 继Bill Immon之后,Ralph Kimball提出了“数据集市的概念”用星型模型和雪花模型重新定义了数据建模思维。此后数十年间,先建立数据集市还是先建立统一的数据仓库,变成数据仓库架构师不停争论的话题。“维度建模”和“雪花模型”成为数据工程师的名片;而BI报表底层也出现了例如Hyprion ESSbase,Cognos等MOLAP引擎,OLAP技术也终于有了系统方法论支撑。 在几十年后,新一代的数据仓库公司也用了Snowflake(雪花模型)作为其公司名称。 2013:大数据概念爆发,Hadoop风靡全球 随着2006年Apache Hadoop的横空出世,低存储成本的大数据系统被企业广泛引用。维克托·迈尔-舍恩伯格在《大数据时代》中给大数据下了定义:“Volume(数据量)、Velocity(数据速度)、Variety(数据多样性)、Value(数据价值)。” 从此轰轰烈烈的建立大数据平台的过程开始起步,10年内,Apache Hadoop、Hive、Spark、Kafka、DolphinScheduler、SeaTunnel、Iceberg……一批大数据技术涌现,大数据平台开始动摇传统数据仓库的地位,以致于2015年后的中国,大多数中国企业存储Pb数据量级的数据平台不会用MPP架构传统意义数据仓库,而一定是用Hadoop或 者Iceberg大数据平台/数据湖。 2015:Snowflake横空出世,New DataStack兴起 随着云的兴起,Marcin Zukowski“向量化”引擎论文的推出,Snowflake横空出世用云原生分离存算的架构,彻底颠覆了传统DW思维。BI工程师第一次可以“随需随用”、弹性扩缩容、不再焦虑集群调度和资源分配。Snowflake把“数仓”变成了“数云”。它带领下一众新一代数据仓库技术栈兴起,Fivetran、Daggster、Airbyte、DBT、WhaleStudio等一批新一代工具出现,在硅谷兴起了New Data Stack(新数据技术栈)的风潮。的确,上一代ETL工具和编程工具还是上个世纪80年代兴起的Informatica、Talend、DataStage这些公司,新技术的兴起的确需要新生态的形成。 整体上,这几十年数据仓库的发展,无论是数据仓库、大数据平台和云数仓和数据湖,基本上整体架构都如下图所示: 在Inmon时代,这个架构叫做DSS系统(决策支持系统),顾名思义,决策支持的就是人。整个数据仓库技术栈都是为人而设计的。 数据仓库的架构也是为数据开发工程师(Data Engineer)来设计的,所以会有N个主题域、要分原子层、汇总层、指标层来帮助ETL工程师进行开发,BI工具也需要建 立星型模型和雪花模型,拖拉拽可视化形成报表和Dashboard。所有的消费者都是人。 但是,这一切,在大模型Agent时代都会发生很大的变化。 Agent正在吞噬传统数据仓库?! 2022年底,OpenAI推出ChatGPT,引爆大模型时代。 2023年后,Llama、Claude、Gemini、G