AI智能总结
DeepSeek的出现,有望带来AI应用的真正落地。DeepSeek正在成为国家风口。 模型平权、推理爆发,看好端侧+应用:1月20日,deepseek-R1模型发布并开源,以RL路径实现了大模型的底层范式创新,大幅降低了先进模型的训练+推理成本,性能比肩SOTA(不含多模态),标志着中国AI从跟随者走向创新者。国产大模型开始引领基础创新,成本下降+性能提升+模型平权为推理侧爆发筑下基础。 模型平权以后,独特数据和场景优势成为应用护城河。模型能力和算力不再是主要壁垒,数据规模和质量、亦或是独特的场景优势,就成为竞争的关键因素。Deepseek加速模型平权和普及,垂直模型和Agent应用有望迎来井喷期,后续我们看好场景和数据积累深厚的公司率先享受AI Agent红利。 算力:Deepseek带动推理需求,国产算力有望受益:Deepseek用户量大幅提升,算力出现紧缺,为国产算力带来机遇。国产芯片厂商和云厂商纷纷适配、上线Deepseek。2月,硅基流动×华为云联合推出基于昇腾云的DeepSeek R1&V3推理服务,华为云与deepseek合作强强联合,比肩海外。中国电子云等国资云上线deepseek,央国企迎来AI时刻。 在AI的应用上,目前形成高度一致预期和很大期待的当属具身智能和自动驾驶。 具身智能:AI终极应用形态,25年量产元年:2025年将成为特斯拉机器人量产元年,国内百家逐鹿具身智能。我们认为deepseek对于降低大模型训练成本和提高研发效率将会有很大助力,加速机器人在应用场景中的落地和产业发展。短期有望迎来重大产业更新。2025年3月17日英伟达将举办2025年GTC大会,而在2024年的英伟达GTC中英伟达展示了其机器人技术,我们预计今年GTC中仍有望更新其在机器人方面的最新进展。 智驾:L3上车元年,中阶智驾有望“标配”:工信部2025年有望发布L3级自动驾驶车辆的相关认证,2025年有望成为国内L3上车元年。中阶智驾有望成为10万元级车型标配,NOA将迎来量产规模大幅提升。 Deepseek有望推进云端大模型训练成本和车端算力部署成本下降,将进一步推进中阶智驾下放。 近期,我们看到中国发布了一系列科技成果,展现出了大国的科技和文化自信。中国的科技自信,将会引领全球的科技方向,因此政策上有加持、正在快速推进的一些中国特色科技产业,需要重视。 鸿蒙走向世界,全球互联网和物联网生态重建:中国制裁谷歌和苹果,鸿蒙迎来国产化机遇。华为手机有望重回全球市场。华为国内份额已经位居第二,全球市场仍未回到前五。“纯血”鸿蒙快速迭代,有望跟随华为手机走向全球市场。我们预计PC鸿蒙有望于2025年3月发布,后续有望进入信创市场。 信创:招标行情已经开启:我们预计党政信创存量设备已经统计完毕,全国多地党政信创招标已经开启。党政信创空间大,2025年是关键一年。各地两会将于2025年3月召开,我们预计招标有望在3月前迎来重大进展。特别国债有望为党政信创提供资金支持。 低空经济:政策+资金共振,2025年迎来落地期:我们认为2025年是低空经济产业实际落地之年,上半年配套较多政策和资金支持。全国低 空经济顶层规划和方案将是重点。资金层面我们预计在国家和各部委的支持下,有望出台相关的补贴政策以支持企业和政府积极落地低空经济建设。基础设施环节有望从政策走向落地,订单将成主要催化。今年6个试点城市的低空经济建设对国内未来低空经济的长期发展起到引领作用,亿航智能OC证也有望获批。 脑机接口:关注侵入式临床进展、非侵入式产品落地:2025年1月,彭博社报道,Neuralink的脑机设备已植入第三名患者体内,埃隆·马斯克宣布,该公司计划在2025年再植入约20至30例,此外国内团队也将在2025年开展多例脑机接口植入手术,侵入式临床进展提速。多家公司近期发布非侵入式产品,商业化进程加快。近期Deepseek开源,将有望助力脑电波信号解码成本进一步降低,脑机接口产业进展有望加速。 相关标的:端侧+应用: 1)大厂线,小米系(金山办公、金山云、金山软件),字节系(汉得信息、润泽科技),阿里系(杭钢股份),腾讯系(泛微网络),华为系(能科科技)等; 2)Agent线,鼎捷数智、上海钢联、汉得信息、泛微网络、彩讯股份、用友网络、金蝶国际、顶点软件; 3)AI+医疗,润达医疗、久远银海、塞力医疗、国新健康、卫宁健康; 4)AI+金融,顶点软件、恒生电子、宇信科技、神州信息、天阳科技; 5)AI+财税,税友股份; 6)端侧,移远通信、广和通、美格智能、乐鑫科技、虹软科技、萤石网络; 7)数据中台及底层设施:星环科技、普元信息、第四范式、优刻得; 8)其他AI应用:科大讯飞、同花顺、三六零、福昕软件、合合信息、新致软件、焦点科技、赛意信息。 算力: 1)云端算力: 云服务厂商:优刻得、青云科技、首都在线等。 华为云:软通动力、中软国际、四川长虹、神州数码、拓维信息、华胜天成、常山北明。 国资云:深桑达A、云赛智联。 其他IDC厂商:杭钢股份、海南华铁、浙数文化等。 国产芯片:寒武纪、海光信息、迈信林等。 国产服务器:神州数码、中科曙光、拓维信息、四川长虹、高新发展等。 2)端侧算力: 端侧芯片:景嘉微、中国长城、龙芯中科、云天励飞等。 具身智能:能科科技、麦迪科技、中科创达、科大讯飞、软通动力、虹软科技、萤石网络、奥比中光、索辰科技、中控技术、海康威视、汉王科技、道通科技。 智驾:江淮汽车、赛力斯、长安汽车、小鹏汽车-W、理想汽车-W、德赛西威、经纬恒润、光庭信息、禾赛科技、速腾聚创、小马智行、知行汽 车科技等。 鸿蒙: 1)行业解决方案:软通动力、润和软件、中国软件国际、常山北明等。 2)办公软件:福昕软件、金山办公等。 3)安全:亚信安全、信安世纪、奇安信等。 信创: 1)经典系列:中国软件,达梦数据,海量数据,神州数码,中国长城,金山办公,纳思达,太极股份等。 2)鸿蒙系列:软通动力,亚信安全,润和软件,中国软件国际,福昕软件,信安世纪,奇安信等。 低空经济: 1)空管:莱斯信息;规划设计:华设集团;监视:四创电子、纳睿雷达; 空天地一体化:中科星图。 2)试点城市:深圳:深城交;重庆:宗申动力;成都:四川九洲;苏州:苏交科;杭州:浙江交科;合肥:四创电子。 3)整机:万丰奥威;引擎:宗申动力;电机:卧龙电驱;飞控:纵横通信。 4)电机:英搏尔;飞控:纵横通信;零件:长源东谷;应用:西域旅游、祥源文旅。 5)无人机:国安达、绿能慧充、纵横股份。 脑机接口:塞力医疗、岩山科技、诚益通、三博脑科等。 风险提示:政策推进不及预期,技术发展不及预期,行业竞争加剧。 1.全面科技自信 2025年春节期间,三家基础电信企业力推最新AI技术普惠应用,均全面接入DeepSeek开源大模型,实现在多场景、多产品中应用,针对热门的DeepSeek-R1模型提供专属算力方案和配套环境,助力国产大模型性能释放。 DeepSeek的出现,有望带来AI应用的真正落地。 资本层面:资本市场的反应是最直观的晴雨表。当下,AI及相关产业在股市中强势上涨,这一现象清晰地表明,DeepSeek的出现为资本领域注入了强大的活力,这种积极的走势无疑是行业发展的重大利好。 市场层面:DeepSeek的横空出世,极大地推动了全球AI市场的应用落地与产业化进程。中国拥有庞大的市场体量,这为AI行业应用企业提供了广阔的发展空间,有望迎来全面爆发。在这片沃土上,一批类似互联网时代的AI平台型和应用型企业将茁壮成长。 技术层面:DeepSeek在技术领域意义非凡,特别是在中文处理能力上表现卓越。 虽然目前它还存在幻觉问题、未完全开源以及推理冗余等不足,但其低成本算力训练模式极大地降低了技术门槛,吸引了更多机构和企业投身于技术生态创新。 创新层面:DeepSeek为创新搭建了坚实的基础,未来,类似李飞飞50美元式的创新成果有望大量涌现。面向行业和个人的特色技术创新将加速迭代,下一代AI技术的创新成果也将更快地从实验室走向实际应用。 产品层面:得益于可开源的基座权重,今年行业和个人应用产品的推出速度将显著提升。这对于新的应用创业者而言,是一次不可多得的机遇。与互联网不同,AI具有去中心化和广泛渗透的特性,这将促使AI的行业和个人应用更加多元化。 用户层面:企业和个人正在加速融入AI时代。如今AI +已不再是要不要做的问题,而是如何做好的问题。用户需求的释放将为行业带来非常大的发展红利。 综上所述,我们正站在一个大时代的风口浪尖,机遇正在加速向我们涌来。 2.模型平权、推理爆发,看好端侧+应用,具备独特数据和场景的 IT厂商受益 事件:幻方子公司深度求索于2024年12月和2025年1月分别发布推理大模型Deepseek-V3和Deepseek-R1同时开源。在多项基准测试中,它在数学、编程等推理上的表现已经和OpenAI的o1不分伯仲,但训练和API调用成本便宜了90-95%。综合看,V3和R1在研究范式上实现了一些原创式创新,对全球大模型研究带来重要影响。 DeepSeek-V3-Base已成为当前性能最强的开源基础模型,Deepseek-R1与GPT-o1性能相近。V3在MMLU基准测试中准确率达85.6%,在GSM8K数学任务中准确率达92.3%。DeepSeek-R1在MMLU、MMLU-Pro和GPQA Diamond等教育知识基准上相比DeepSeek-V3显示出卓越性能,在数学任务上的性能与OpenAI-o1-1217相当,远超其他模型。 图1:Deepseek-V3性能 图2:Deepseek-R1性能 Deepseek-V3通过架构和工程优化显著降低成本:基于提升性能和降低成本的双重目标,通过架构设计有效减少了对高性能硬件(GPU)的依赖,1)DeepSeek-V3采用了MLA(多头部潜在注意力机制)来确保推理效率,2)使用DeepSeekMoE(自研混合专家)来实现经济高效的训练,3)通过DualPipe算法实现了计算-通信重叠,减少管道气泡,提升训练效率,4)首个在超大规模模型上成功验证了FP8混合精度加速训练框架的有效性。最终Deepseek-V3完整训练仅需278.8万H800 GPU小时,训练部分成本仅为557万美元,远低于国内外其他已知模型。 R1在强化学习领域实现原创突破:1)开源DeepSeek-R1-Zero,首次验证了纯RL(强化学习)在LLM中显著增强推理能力的可行性,没有进行SFT(监督微调),避免了大量标注数据的成本和耗时。2)R1提出了多阶段训练策略(冷启动SFT-> RL->COT +通用数据SFT(80w)->全场景RL),有效兼顾准确率与可读性。3)直接用上面的80w数据进行SFT,展示了知识蒸馏在提升小模型推理能力方面的潜力,并开源多个大小不一的蒸馏模型(1.5B~70B)。4)在DeepSeek-R1-Zero的训练历程中,还出现了模型自我反思的“顿悟时刻”。 2)1月29日,阿里通义千问旗舰版模型Qwen2.5-Max发布,预训练数据超过20万亿tokens,比肩Claude-3.5-Sonnet,在多项公开主流模型评测基准上录得高分,甚至高于GPT-4o、DeepSeek-V3及Llama-3.1-405B。 3)2月3日,ChatGPT发布新Agent“Deep Research”,基于o3模型做了特殊优化,把推理大模型的思考能力用于联网搜索,综合多个信息来源,一次查询响应时间5分钟-30分钟不等,目标是“完成人类专家需要几个小时的复杂研究任务”。在“人类最后的考试”上,Deep Research刷新了最高分,比o3-mini高推理设置分数高出一倍 2.2.影响:模型平权,推理爆发 国产大模型开始引领基础创新,成本下降+性能提升+模型平权为推理侧爆发筑下基础: 1)中国科技重估。De