行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

机械设备事件点评：DeepSeek有望为机器人带来质效跃迁，关注多模态交互进展

机械设备 2025-02-15 王凯爱建证券洪雁

DeepSeek脱颖而出，价格优势显著
- 推理能力：DeepSeekV3和R1模型在MATH、GPQA等测试中表现与OpenAI-o1相当，准确性高。
- 成本优势：输入和输出令牌定价显著低于Claude-3.5、GPT-4等竞品，如V3每百万输入令牌定价仅为0.27美元。
- 技术架构：基于MLA+MoE，MLA通过低秩联合压缩降低内存占用，MoE架构提升算力利用率，训练成本大幅降低（DeepSeek仅用2000张H800 GPU，成本2.788MGPU小时，而Llama3.4需557.6万美元）。
DeepSeek坚定开源路线，提升模型效能
- 架构创新：MLA+MoE架构，V3通过无辅助损失负载均衡策略优化MoE性能，共享专家提升效率。
- 技术迭代：V3采用FP8训练、多tokens预测等优化，算力利用率提升，每个Token激活参数量仅37B。
- 商业模式：专注AI长尾领域，为中小型企业提供低成本定制方案，通过精细化运营和开源技术降本。
多重催化剂助力人形机器人产业
- AI智能体爆发：2025年或成AI智能体元年，DeepSeek作为大模型助力技术演进，降低算力依赖。
- 人形机器人需求扩张：特斯拉Optimus放量预期推动FSD芯片需求，DeepSeek可降低“GenAI+强化学习+多模态感知”成本。
- 应用场景：工业、物流、医疗等领域率先落地，DeepSeek多模态交互和任务分解能力将助力机器人智能化。
商业模式展望
- 参考英伟达ProjectGR00T和Figure机器人路径，DeepSeek可能通过构建机器人B端用户平台或帮助自研模型实现“自主化”盈利。
- 价值测算：DeepSeek算力成本可节省88.8%，为国产算力提供利润空间，假设Optimus2027年出货100万台，DeepSeek或贡献6.9亿美元潜在收益。
风险提示
- 国际贸易摩擦、宏观环境波动、新技术投产不达预期。

行业研究/行业点评 2025年02月15日 DeepSeek有望为机器人带来质效跃迁，关注多模态交互进展 ——事件点评本期投资提示：强于大市 DeepSeek脱颖而出，价格优势显著。推理能力上，DeepSeekV3和R1模型经测试可对标OpenAI-o1推理表现；成本上，在输入令牌的数量和令牌定价相较海外竞品具有显著成本优势。技术路径上，DeepSeek基于MLA+MoE架构，MLA是其降低推理成本的关键创新。MoE架构和预训练形成模型差异化优势，减少集群训练中等待期，提升算力利用率。我们认为，DeepSeek将逐渐打破行业对算力的过度依赖，启发业界将目光由训练端转向推理端。MoE效率提升在后续不仅不会减少相关投资，反而会通过模型算力成本降低实现AI部署“普惠化”，推动整体经济效益扩大。 坚定开源路线，提升模型效能，吸引大量B端用户部署。下游应用上，尽管闭源大模型厂商提供微调服务，但受限较多，同时应用端在使用私有数据微调时亦存在顾虑。而V3系列使得私有部署和自主微调成为可能，为下游应用带来远超闭源时代的弹性空间。在DeepSeek性能逐渐达到甚至超过海外闭源模型时，以GPT4、Mistral为代表的闭源方案在价格以及应用场景等方面将丧失掉原有竞争力。开源和闭源模型在细分应用场景上并不矛盾，DeepSeek会被高校、实验室等用户优先采用，并不会对云厂商产生直接竞争。资料来源：聚源数据，爱建证券研究所相关研究《AI深度耦合机器人：解锁智能时代产业“密钥”》2025/02/10 DeepSeek有望赋予人形机器人多模态交互和工业场景。目前，人形产业趋势逐渐明朗，自研人形整机的放量预期对其决策层组成部分— —FSD芯片需求产生扩张。按照目前TeslaOptimus最新指引，2024-2035人形机器人会率先在工业、物流、医疗以及零售等领域率先落地；2035年后会实现家用的全场景和个性化覆盖。DeepSeek高质价比的推理能力有望在多模态人机交互、复杂环境下的指令理解和工业场景任务分解助力。 指数表现：根据DeepSeek概念（886100），春节后开盘至今（2025/2/7-2025/2/14），指数区间涨幅+22.82%，与智能制造相关个股主要为供水、储能、测试设备公司如领储宇能旗下AI平台部署R1模型后发酵，后续有望为公司主营业务降本增效。 推荐组合：①目前特斯拉Optimus量产在即，相关产业链，与人形机器人板块相关性较强的标的有望迎来新的发展机遇。建议关注：总成（三花智控：T链核心供应商、拓普集团：特斯拉重要合作商，灵巧手送样+电机自研）、减速器（绿的谐波：通过国际ISO9001质量认证）、丝杠（北特科技：T链具备较高的确定性、贝斯特：行星滚柱丝杠顺利出样等）、传感器（安培龙、汉威科技等）、设备（秦川机床：机床供货来源华中+华中自研RTCP等）②全球半导体行业景气度不断提升，国产替代持续推行。建议关注：北方华创、中微公司、拓荆科技等。 风险提示：国际贸易摩擦风险、宏观环境波动风险、新技术投产不达预期。证券分析师王凯S0820524120002021-32229888-25522 请仔细阅读在本报告尾部的重要法律声明 1.Deepseek脱颖而出，价格优势显著 DeepSeek模型与ChatGPT等世界先进的大模型不分高下。在大语言模型领域，DeepSeek模型凭借创新技术架构脱颖而出。(1)推理能力测评，DeepSeek模型在MATH、GPQA等权威测试中，与OpenAI-o1的推理表现不相上下，展现出极高的准确性。(2)成本结构，DeepSeek价格优势明显，以V3每百万输入令牌和输出令牌定价相较于Claude-3.5等竞品相比呈现出显著的成本优势。资料来源：DeepSeek-V3TechnicalReport，爱建证券研究所 2.DeepSeek坚定开源路线，模型效率持续提升 2.1DeepSeek基于MLA+MoE架构，持续更新迭代 DeepSeek基于MLA+MoE架构，坚定开源路线，持续更新MoE、推理、多模态模型。MLA是DeepSeek高效推理的核心，通过低秩联合压缩技术减少推理时的关键值（KV）缓存，降低实际占用内存，提升了模型处理效率；MoE是由许多专门从事不同领域的小型模型组成的大型模型,通过少量参数改变，实现降本增效。模型构造方面，DeepSeekV3坚持自研了MLA注意力机制和无辅助损失负载均衡策略的MoE架构，与DeepSeek-V2相比，无辅助损失的负载均衡策略的引用用于DeepSeekMoE，减轻因需要保证Expert负载均衡而导致的性能下降。DeepSeekV3通过共享专家，整体预训练用了14.8万亿的高质量Token，并持续更新SFT和RL，总参数量达到671B，而每个Token激活参数量仅37B，做到高效的推理和训练。资料来源：DeepSeek-V3TechnicalReport，爱建证券研究所 2.2V3技术更新迭代，算力利用率持续攀升 DeepSeek-V3技术差异化，通过双侧推卡，减少集群训练中机器数据的等待期，提升MFU（算力利用率）。V3通过工程、算法上的优化，使模型训练、推理成本得到极大的降低。(1)架构上：采用了MOE架构（专家模型混合体）并为MOE 开创了负载平衡的无损失策略。MOE痛点在如何确定将各种类型令牌交给何类子模型或“专家”。而DeepSeek选择实施“门控网络”，在不影响性能下将令牌路由到合适专家，每个标记在训练中只需改变少量参数，效率得到提升。同时，DeepSeek研究了多tokens预测，并证明其有利于模型性能，也可以用于推理加速的推测解码。(2)预训练：首次在超大规模模型上验证了FP8训练的可行性和有效性；通过算法、框架和硬件协同设计，克服了跨节点MOE训练中的通信瓶颈，显著增强了训练效率并降低训练成本。(3)后训练：引入创新方法，将cot模型中的推理能力提炼到标准LLMs中。 DeepSeekV3相比Llama3成本控制显著，算力依赖程度低。DeepSeek仅使用2000张H800的GPU（图形处理单元）进行训练，算力的依赖小，训练成本2.788MGPU小时（多GPU计算时所消耗时间）。而Llama3405B的训练时长较高，训练成本557.6万美元（约合4070万人民币）。DeepSeek算力优化成效较大，降本增效显著。DeepSeek-R1通过重新设计训练流程、以较少的SFT数据+多轮学习强化，提高模型准确性的同时，显著降低了内存占用和计算开销。DeepSeek-V3拥有6710亿参数。实际运行中，每个输入仅激活370亿参数，大幅降低计算成本。 3.多重催化剂助力人形产业聚势 3.1AI大模型的催动 AI智能体爆发，助力AI大模型技术演进。自2024年以来，AI智能体成为AI技术公司重点发力对象，比如苹果的AppleIntelligence、Anthropic公司的ComputerUse、谷歌Jarvis、OpenAI的Operator等，2025年或将是AI智能体爆发之年。据咨询机构Gartner预测，2028年至少有15%的日常工作决策将由AI智能体自主完成。与生成式AI不同，AI智能体是目标驱动型的，能够完全执行工作流程，适应、学习、迭代、与其他系统和人类协作，并端到端地完成任务，可以看作是大模型通用操作系统（LLM-OS）的雏形。DeepSeek便是一款基于Transformer结构的语言模型，采用了多层堆叠和多头自注意力机制，以及残差连接和层归一化等技术，使得模型能够更好地捕捉语言特征和上下文信息，拥有高达670亿参数，超越了国际领先的Llama2模型，展现出了强大的性能和潜力。中观层面，DeepSeek部署浪潮下，当“国产低端芯片构建人工智能”在DeepSeek全局部署后成为现实，该预测会传导至人形机器人行业，在电车、电池领域的国产供应链自主和主导地位会蔓延至AI机器人。细分赛道上，在危险程度较高、自动化需求迫切的机器人种类会优先受益，其次是家用场景。同时，根据物流机器人落地在”最后一百米”的现实解决方案看，人形机器人在中低端市场并不会严重受到先进算力芯片管制的影响，算力“不需高质，只需大量”会在C端市场得到充分体现。按照目前TeslaOptimus最新指引，2024-2035人形机器人会率先在工业、物流、医疗以及零售等领域率先落地；2035年后会实现家用的全场景和个性化覆盖。 3.2DeepSeek对人形机器人产业的催化机器人：人形产业趋势逐渐明朗，自研人形整机的放量预期对其决策组成部分--FSD芯片的需求日益扩张。2024年4月，特斯拉推出多模态大模型Grok-1.5v，利用端到端高速大模型FSD推理，有望连接数字世界与物理世界，解决自动驾驶边缘案例的在线迭代学习问题。目前，特斯拉人形机器人Optimus的主控芯片采用了其自研Soc（SystemonChip），参照当前HW3（Hardware3.0）驾驶辅助系统的算力，Optimus算力为72Tops；AI训练芯片则采用了特斯拉DojoD1超级计算机芯片，每个D1单元之间无缝连接，相邻芯片之间的延迟低，训练模块实现了更大程度的带宽保留，实现了高达9千万亿次的算力。（类比智能驾驶行业，人形机器人核心壁垒在于拥有数据训练闭环体系、硬件供应链自主且拥有强悍的AI软件能力。在机器人智能侧，DeepSeek的全局部署会为"GenAI+强化学习+多模态感知”的智能化环节全面降低成本。在具体技术路线上：1.参照TeslaOptimusFSD的AI体系（但实际仍依赖PID+反馈控制）2.能量管理优化：利用AI预测机器人能耗，动态调整充电策略，提升定位校准能力；3.力触觉AI模型：使用CNN、RNN或Transformer处理高维触觉数据，优化物体识别和分类系统。事件1：【DeePSeeK模型有望赋予人形机器人多模态交互和工业场景】 2月7日消息，据澎湃新闻报道，优必选正在验证DeepSeek技术在人形机器人应用场景中的有效性，包括多模态人机交互、复杂环境下的指令理解、以及工业场景中的任务分解与规划等。公司希望借助推理大模型的深度思考能力，破解这些复杂任务的挑战，使人形机器人更接近人类的思维方式和行为表现。事件2：【DeepSeek有望提升机器人数据处理能力，推进“GPT”时刻到来】中国的激光制造商RoboSense在2025年1月3日的“HelloRobot”在线活动中推出人形机器人组件。数据被认为是人形机器人进入“ChatGPT”或“苹果”时刻的主要瓶颈，这一领域正受到更多重视。 4.商业模式 4.1商业初衷：瞄准长尾 DeepSeek瞄准AI应用的广阔长尾领域。避开与大厂在高端技术研发，专注为中小型企业、初创团队以及特定行业提供定制化、低成本的AI解决方案。差异化竞争为其赢得了稳定的客户群体和持续的现金流。精细化运营、简单实用的产品设计，回归商业本质和创新商业模式。DeepSeek通过精细化运营实现资源的最大化利用，公司内部从研发、采购、市场营销各环节力求投入获取最大的价值产出。DeepSeek还积极利用开源技术、云服务等外部资源，进一步压缩成本。 4.2展望海外平台盈利模式核心观点：纵观海外具身智能大模型，我们认为DeepSeek可能会参考对标海外机器人和大模型头部公司的盈利路径。（1）参考英伟达人形机器人通用基础模型ProjectGR00T，在实现人形机器人端到端部署后构建粘性更高的机器人B端用户平台。（2）参照Figure机器人路径，DeepSeek帮助B端用户构建自研多模态。 NVIDIAIsaacGR00T以技术授权、云服务、硬件支持、构建机器人生态为盈利模式。IsaacGR00T是NVID

点击免费查看完整报告

机械设备事件点评：DeepSeek有望为机器人带来质效跃迁，关注多模态交互进展

你可能感兴趣

计算机行业人工智能系列报告(六)：交互型多模态大模型有望带来应用的爆发起点

人形机器人行业主题事件点评：特斯拉机器人进展加速，核心零部件有望受益

事件点评：中科创达的“星辰大海”：多模态机器人操作系统

投资银行业与经纪业行业事件快评：关于《证券公司监督管理条例》修订的点评-提升服务实体经济质效，投行共识再凸显

机械设备行业周报：关注检测行业收购整合，期待机器人研发进展

机械设备行业周报：关注具身智能机器人商业化进展，期待行业标准与生态共建

机械设备行业跟踪周报：关注国产化加速的机器人行业，持续推荐光伏新技术带来的设备投资机会

新能源点评：汽车八月有望回暖，机器人关注事件催化

公司2024年助剂业务质效双增,未来固氮产品放量有望打造新的增长曲线-2024年报及2025年一季报点评

机械设备行业点评报告：从机器人格斗大赛看，人形机器人产业进展走到哪一步？