您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[清华大学]:清华大学DeepSeek课堂 - 发现报告

清华大学DeepSeek课堂

2025-02-26清华大学王***
AI智能总结
查看更多
清华大学DeepSeek课堂

超级火爆!错过现场,就不要再错过这份PPT!收藏、转发!课堂听众最新反馈—— 国内DeepSeek最前沿资料政企、创业者必读《DeepSeek给我们带来的创业机会》360集团创始人周鸿祎 一张图读懂一堂DeepSeek课 AI给了一个比互联网更大的机会互联网是连接平台,人工智能是生产力互联网是赋能性技术,生产力属性较弱人工智能既能单兵作战,也能外部赋能互联网创造了能写140个字的推特和分享照片的InstagramAI能帮助人解决登陆火星、能源自由的问题 大模型是真智能,是人工智能的重大拐点。你相不相信?大模型是一场工业革命,将重塑所有产品和业务。你相不相信?不拥抱AI的组织和个人,会被拥抱AI的组织和个人淘汰。你相不相信?建立AI信仰 大模型不是泡沫,而是新一轮工业革命的驱动引擎蒸汽革命电气革命信息革命以大模型为代表的人工智能革命人工智能是新质生产力的关键支撑技术,人工智能+百业千行将带动新一轮工业革命,为高质量发展注入强大动能大模型的进一步突破将引领人类社会进入智能化时代,对我们的生活方式、生产方式带来巨大变革重塑经济图景解决复杂问题 AI不仅是技术革新,更是思维方式和社会结构的变革国家产业个人企业 人工智能发展历程(一)从早期基于规则的专家系统,走向基于学习训练的感知型AI从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI从擅长理解的认知型AI,发展到擅长文字生成的生成式AI从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI从生成式AI,发展到推理型AI感知AI认知AI生成式AI 人工智能发展历程(二)从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI从数字空间中的AI,走向能理解和操控物理空间的AI从解决现实问题的AI,走向解决科学问题的科学型AI大模型AI智能体AI物理AI科学AI 面对全球大模型产业之争,要打赢「三大战役」AGI之战应用场景之战大模型安全之战•探索超越人类的超级人工智能AGI•不仅是科技之争,更是国运之争•不发展是最大的不安全,发挥举国体制优势,打赢追赶之战•大模型带来前所未有安全挑战•外挂式传统安全手段难以应对•应对模型安全新挑战,打赢未雨绸缪之战•大模型是能力而非产品,结合场景才能发挥价值•中国拥有最完整的产业链、最全的工业门类、最丰富的场景•发挥场景优势,加速传统产业数转智改,打赢弯道超车之战AGI是全球少数玩家的游戏,政府、企业、创业者更多创新的机会在应用之路 把大模型拉下神坛!走入千家万户、百行千业,才能掀起新工业革命•当年IBM做出超级电脑,并没有带来工业革命,因为只有少数人用•IBM甚至声称,全世界只用5台电脑就够了•真正带来信息革命的是个人电脑走入千家万户、百行千业当年的电脑当今的大模型•如果需要十万或百万张卡起玩,就无法产生工业革命•只有把大模型拉下神坛,让大模型走进千家万户、百行千业,才能掀起新一轮工业革命 DeepSeek出现之前我们对大模型发展趋势的十大预判 DeepSeek出现之前的十大预判之一传统AGI发展步伐在放慢需要寻找新方向Scaling Law边际效应递减人类训练数据接近枯竭合成数据无法创造新知识推理能力难以泛化,成本高昂全面超越人类的人工智能在逻辑上不成立 DeepSeek出现之前的十大预判之二慢思考成为新的发展模式大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」大模型厂商都在探索慢思考、思维链技术 DeepSeek出现之前的十大预判之三模型越做越专除了少数科技巨头,大多数公司都专注于做专业大模型MoE架构盛行,本质是多个专家模型组成一个大模型Deepmind的Alpha系列产品是这一趋势的最佳诠释 DeepSeek出现之前的十大预判之四模型越做越小大模型进入「轻量化」时代,上车上终端,蒸馏小模型先做得更大,然后探索能做多小 DeepSeek出现之前的十大预判之五知识的质量和密度决定大模型能力高质量数据、合成数据使模型知识密度的快速增长大模型能以更少的参数量达到更高的性能360联合北大研发:5%参数量逼近Deepseek-R1满血性能 DeepSeek出现之前的十大预判之六成本越来越低过去一年,大模型成本「自由落体」国外:GPT-4等效智能在过去18个月内价格下降240倍国内:大模型「亏本」卖,可以「白嫖」大模型API能力 DeepSeek出现之前的十大预判之七多模态越来越重要由文本生成迈向图像、视频、3D内容与世界模拟多模态模态在能力变强的同时,规模正在变小 DeepSeek出现之前的十大预判之八智能体推动大模型快速落地能够调用各种工具,具有行动能力调用企业专业知识,更懂企业将日常重复性业务流程形成Playbook,实现流程自动化通过目标拆解,多次调用大模型以及专家模型协同,形成慢思考能力传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力 DeepSeek出现之前的十大预判之九开源效果追赶上闭源技术开放,吸引广大开发人员和用户使用很多公司参与开源,帮助改进产品,众人拾柴火焰高,反哺开源产品,形成正循环 DeepSeek出现之前的十大预判之十中美差距快速缩小美国预训练堆算力的路线不可持续,有待发现新范式“换道超车”软件和算法差距并不大,主要差距在工程、硬件等方面 DeepSeek的出现验证了我们的预判而DeepSeek的创新更具颠覆性 DeepSeek是完美的颠覆式创新技术创新——让过去做不到的事情可以做到体验创新——让使用起来很难很复杂的东西变得很简单易用市场推广创新——让过去很难得到的东西可以得到商业模式创新——让过去很昂贵的东西变得很便宜甚至免费DeepSeek正是符合这四种创新模式的完美例子颠覆式创新的四种方式 DeepSeek-R1突破了大模型Scaling Law瓶颈导致大模型悲观论认为大模型的能力无法进一步得到质的提升开辟强化学习新范式从预训练Scaling Law转变为强化学习Scaling Law大数据+大参数+大算力的预训练Scaling Law的边际效应递减•人类构造的训练数据已达上限•万亿参数规模之后,继续增大参数规模难以带来质的提升•训练算力成本和工程化难度大幅上升强化学习Scaling Law•利用合成数据解决数据用尽问题•利用self-play强化学习,在不增大参数规模前提下,大幅提升复杂推理能力•通过后训练算力和推理算力,在不增加预训练算力前提下,大幅提升模型性能DeepSeek颠覆式创新——技术创新 预训练模型如GPT——疯狂读书,积累知识,Scaling law撞墙预训练模型思考深度不够算力见顶,变成少数巨头游戏预训练大模型推理大模型预训练大模型难以通往AGI之路推理模型如R1——通过逻辑链条推导答案,分解规划,自我反思预训练范式像是记忆和模仿,强化学习范式更像探索实践记住很多东西只是基础,真正有价值的是融会贯通R1找到了人类通往AGI的方向DeepSeek颠覆式创新——技术创新DeepSeek-R1和GPT-4o不是同一个物种 快思考慢思考快慢人类真正智力表现的形式直觉经验型速度快、准确性低GPT、DeepSeek-V3擅长的思考方式推理能力获得突破的关键是学会了「慢思考」例:课堂提问快问快答长思维链强大的推理能力是真正人类智力的体现预训练大模型是人记忆和学习的能力,推理模型是对复杂问题进行规划、分解、预测的能力,实现了真正的慢思考例:课后作业仔细思考 DeepSeek-R1是AI发展史上的重要里程碑R1形成了新的AGI定律,加速了AGI发展•Alpha Go采用监督学习,•Alpha Zero采用强化学习,ChatGPT时刻•OpenAI ChatGPT大模型,通过预训练方式,实现涌现,理解人类语言和知识•诞生预训练Scaling LawDeepseek-R1时刻•o1采用强化学习,但训练复杂推理能力,技术未公开•DeepSeek-R1探索出RL方法,且公开技术•诞生推理型Scaling LawDeepSeek颠覆式创新——技术创新 Alpha Zero时刻使用人类棋谱训练自己跟自己对弈 技术上实现对美国的赶超掌握通向AI下一阶段的方法论DeepSeek颠覆式创新——技术创新美国人仍在遵循预训练Scalinglaw范式,走堆显卡路线,如“星际之门”计划中国DeepSeek-R1的创新突破,诞生推理型Scaling Law,改写AI发展方向 DeepSeek在用户体验上实现了三件事更加理解用户需求,降低Prompt要求直接呈现思维过程,展现像真人一样思考的能力可实时联网,把搜索能力与推理能力结合DeepSeek颠覆式创新——用户体验具备强大推理能力,思维过程更加缜密,智能性提升用起来更像真人,写作能力更强,想象力更丰富 DeepSeek-R1用户体验改善的作用R1在零广告投入下7天增长1亿用户,创最快应用破亿里程碑把人工智能从不可用、凑合用,变成大家都能用、都爱用推动市场加速发展,在中国用户、企业和政府彻底普及了一次AI中国可能成为全球AI普及率、渗透率最高的国家,加速了中国爆发AI产业革命的步伐DeepSeek颠覆式创新——用户体验——掀起新一轮AI科普教育认知决定行动,这场全民AI科普对推动中国AI发展功不可没 开源改变行业格局,建立强大生态开源战胜闭源,促使全球公司、开发者等转到开源建立强大生态,成为全球人工智能根技术,无推广情况下各国政府、企业、云厂商纷纷接入,获得全球最大影响力改变中美竞争格局:美国是闭源封闭垄断思路,中国领导开源文化,加速中国领先地位中国人民使用的AI工具先进性已超过美国,普及率超过美国,使用AI人口超过美国总人口,且直接用上最先进的DeepSeek-R1 新时代下的集中力量办大事每个企业都可以直接使用DeepSeek,因为开源透明可信任,企业和政府可做大量私有化部署一个开源产品获得突破之后,全世界都能分享成果,结束中国百模大战,节省大量成本很多公司参与开源,帮助改进产品,很多人基于DS生态开发应用产品,增加影响力,人人为我,我为人人技术开放,对人工智能行业形成蓬勃发展,寒武纪大爆炸,推动AGI行业发展 成本的急剧降低DeepSeek可适配国产硬件,促进国产硬件发展DeepSeek的优化降低对推理硬件的要求,减少推理成本训练成本降低,堆显卡模式受质疑,探索新思路,算法优化空间大无需训练自己的基座模型,直接部署在DeepSeek上,不用重复发明轮子公开蒸馏方法,帮助其他模型提升能力,实现了模型制造模型,犹如工业母机小模型可部署在企业内电脑或一体机上,使用成本降低,形成分布式推理网络技术门槛降低,可标准化、SaaS化部署,下载就能用DeepSeek颠覆式创新——成本暴跌 惠及全球人民,科技平权,技术平民化运营商、云服务可免费用,降低云服务成本大型企业可使用多个DeepSeek,解决不同场景需求中小企业免费部署,消除数字鸿沟个人可以拥有自己的DeepSeek,可以成为超级个体对于创业者得到世界最先进大模型,如虎添翼,和巨头站在同一起跑线上很多发展中国家都能成为大模型玩家,实现人类命运共同体DeepSeek颠覆式创新——免费 DeepSeek引爆应用奇点东西又好又免费,每个人都能拥有DeepSeek颠覆式创新——结论企业中各场景都可用DeepSeek改进,降本增效,企业应用爆发所有产品都值得被DeepSeek重构,产品应用爆发创业公司得到DeepSeek加持,创业者拥有便宜领先的大模型,迎来机遇,带来“iPhone时刻”中国变成AI渗透率最高的国家,率先实现AI工业革命 万物智能科学研究应用爆发的六大方向 DeepSeek的开源和低成本使得个人也能够拥有自有大模型,实现超能力,成长为超级个体DeepSeek六大应用方向之一人人智能:人人都要用AI 真正的机会是利用AI把所有的硬件重做