您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [赛迪]:deepseek大模型生态报告 - 发现报告

deepseek大模型生态报告

信息技术 2025-02-15 - 赛迪 dede
报告封面

目录 一、DeepSeek大模型背景.......................1 (一)深度求索公司情况...................1(二)模型迭代历程.......................2(三)研发团队情况.......................31.北京大学罗福莉............................................42.北京大学高华佐............................................43.北京邮电大学曾旺丁....................................54.北京大学朱琪豪............................................55.北京大学代达劢............................................66.北京大学王炳宣............................................67.浙江大学梁文锋............................................7 二、DeepSeek大模型应用现状...................8 (一)国内情况...........................8(二)全球情况..........................10 三、DeepSeek大模型技术特点..................11 1.压缩:从结构到量化..................................11(1)多层注意力MLA...........................12(2)FP8混合精度训练框架................132.并行:对硬件的极限使用..........................16(1)DualPipe跨节点通信.....................16(2)无辅助损失的负载均衡策略.........18(3)底层通信优化.................................203.总结..............................................................20 (一)企业..............................22 1.DeepSeek系列新模型正式上线昇腾社区,华 II为小艺已接入DeepSeek..........................................222.三大运营商全面接入DeepSeek.................233.多家公司宣布接入DeepSeek.....................234.微软、英伟达、亚马逊全部接入DeepSeek!....................................................................................255.燧原科技实现全国各地智算中心DeepSeek的全量推理服务部署...............................................266.多家券商也积极“拥抱”DeepSeek..........26(二)生态..............................271. Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜..................272. DeepSeek在开源社区GitHub上的Star数首次超越OpenAI.........................................................283.国家超算互联网正式上线DeepSeek.........294.传DeepSeek正准备适配中国国产GPU...295. DeepSeek的风,火速吹遍了终端企业......30(三)应用..............................321.文学..............................................................322.编程..............................................................32(四)基础设施..........................35五、DeepSeek大模型产业影响..................35(一)对人工智能技术的影响..............351.吴恩达谈DeepSeek:中国AI迎头赶上,扩大算力并不是AI进步的唯一途径.........................352.蒸馏技术将成为行业突破口......................36(二)对产业生态的影响..................371. DeepSeek开源对于企业战略价值..............372. DeepSeek是否真的绕开了CUDA?.........393. DeepSeek会导致对智算中心的需求大幅减少吗?........................................................................39 (三)对国际竞争的影响..................461. DeepSeek的崛起,冲击了全球科技供应链的核心玩家...................................................................462. AI低成本化,最大输家可能不是Nvidia,而是依赖大模型收费的AI公司.................................463. AI进入创业黄金时代..................................474. DeepSeek的崛起引发了全球资本市场的剧烈震荡........................................................................47 1.中国常驻联合国代表傅聪回答记者提问..482.外交部发言人郭嘉昆主持例行记者会......49 (二)地方层面..........................49 1.广东..............................................................492.郑州..............................................................493.北京经济技术开发区..................................49 七、各国相关表态............................50 IV(二)英国及欧洲........................541.龙头企业单位..............................................54(1)英国阿兰·图灵研究所.................54(2)德国墨卡托中国研究中心.............54(3)英国利兹大学.................................55(4)荷兰阿斯麦.....................................552.政府及公共机构..........................................55(1)意大利.............................................55(2)爱尔兰.............................................55(3)法国.................................................55(三)韩国..............................561.龙头企业单位..............................................56(1)韩国.................................................56(2)LG....................................................56(3)三星.................................................562.政府及公共机构..........................................56(1)韩国代理总统崔相穆将DeepSeek称之为“新的冲击”...........................................57(2)韩国祥明大学.................................57(四)其他国家..........................571.政府及公共机构..........................................57(1)澳大利亚.........................................58(2)日本.................................................58(3)印度.................................................58八、DeepSeek大模型的经验启示................58(一)技术..............................581.中科院为何难现DeepSeek式突破............58(1)制度基因的先天性分野.................58(2)创新效率的量子级差距.................60(3)体制突围的艰难探索.....................62(4)破局之道:构建科技创新共同体.63(5)超越二元对立的创新哲学.............64 2.王凡、刘少山:中国如何引领全球具身智能?DeepSeek的战略启示|AI观察.............................64(1)DeepSeek的突破对具身智能的启示............................................................................65(2)DeepSeek:推动中国AGI领域自主创新...................................................................66(3)具身智能:人工智能从虚拟世界走向物理世界...........................................................67(4)上下文强化学习:具身智能的发展方向........................................................................68(5)具身智能的应用前景与行业变革.70(6)政策建议:开源发展、标准化和产业化落地...............................................................71(7)结论:把握技术机遇,领导未来的全球AI竞争............................................