您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [爱建证券]:机械设备事件点评:DeepSeek有望为机器人带来质效跃迁,关注多模态交互进展 - 发现报告

机械设备事件点评:DeepSeek有望为机器人带来质效跃迁,关注多模态交互进展

机械设备 2025-02-15 王凯 爱建证券 洪雁
报告封面

行业研究/行业点评 2025年02月15日 DeepSeek有望为机器人带来质效 跃迁,关注多模态交互进展 ——事件点评 本期投资提示: 强于大市 DeepSeek脱颖而出,价格优势显著。推理能力上,DeepSeekV3和R1模型经测试可对标OpenAI-o1推理表现;成本上,在输入令牌的数量和令牌定价相较海外竞品具有显著成本优势。技术路径上,DeepSeek基于MLA+MoE架构,MLA是其降低推理成本的关键创新。MoE架构和预训练形成模型差异化优势,减少集群训练中等待期,提升算力利用率。我们认为,DeepSeek将逐渐打破行业对算力的过度依赖,启发业界将目光由训练端转向推理端。MoE效率提升在后续不仅不会减少相关投资,反而会通过模型算力成本降低实现AI部署“普惠化”,推动整体经济效益扩大。 坚定开源路线,提升模型效能,吸引大量B端用户部署。下游应用上,尽管闭源大模型厂商提供微调服务,但受限较多,同时应用端在使用私有数据微调时亦存在顾虑。而V3系列使得私有部署和自主微调成为可能,为下游应用带来远超闭源时代的弹性空间。在DeepSeek性能逐渐达到甚至超过海外闭源模型时,以GPT4、Mistral为代表的闭源方案在价格以及应用场景等方面将丧失掉原有竞争力。开源和闭源模型在细分应用场景上并不矛盾,DeepSeek会被高校、实验室等用户优先采用,并不会对云厂商产生直接竞争。 资料来源:聚源数据,爱建证券研究所 相关研究 《AI深度耦合机器人:解锁智能时代产业“密钥”》2025/02/10 DeepSeek有望赋予人形机器人多模态交互和工业场景。目前,人形产业趋势逐渐明朗,自研 人 形 整 机 的 放 量 预 期 对 其 决 策 层 组 成 部 分— —FSD芯 片 需 求 产 生 扩 张 。 按 照 目 前TeslaOptimus最新指引,2024-2035人形机器人会率先在工业、物流、医疗以及零售等领域率先落地;2035年后会实现家用的全场景和个性化覆盖。DeepSeek高质价比的推理能力有望在多模态人机交互、复杂环境下的指令理解和工业场景任务分解助力。 指数表现:根据DeepSeek概念(886100),春节后开盘至今(2025/2/7-2025/2/14),指数区间涨幅+22.82%,与智能制造相关个股主要为供水、储能、测试设备公司如领储宇能旗下AI平台部署R1模型后发酵,后续有望为公司主营业务降本增效。 推荐组合:①目前特斯拉Optimus量产在即,相关产业链,与人形机器人板块相关性较强的标的有望迎来新的发展机遇。建议关注:总成(三花智控:T链核心供应商、拓普集团:特斯拉重要合作商,灵巧手送样+电机自研)、减速器(绿的谐波:通过国际ISO9001质量认证)、丝杠(北特科技:T链具备较高的确定性、贝斯特:行星滚柱丝杠顺利出样等)、传感器(安培龙、汉威科技等)、设备(秦川机床:机床供货来源华中+华中自研RTCP等)②全球半导体行业景气度不断提升,国产替代持续推行。建议关注:北方华创、中微公司、拓荆科技等。 风险提示:国际贸易摩擦风险、宏观环境波动风险、新技术投产不达预期。 证券分析师 王凯S0820524120002021-32229888-25522 请仔细阅读在本报告尾部的重要法律声明 1.Deepseek脱颖而出,价格优势显著 DeepSeek模型与ChatGPT等世界先进的大模型不分高下。在大语言模型领域,DeepSeek模型凭借创新技术架构脱颖而出。(1)推理能力测评,DeepSeek模型在MATH、GPQA等权威测试中,与OpenAI-o1的推理表现不相上下,展现出极高的准确性。(2)成本结构,DeepSeek价格优势明显,以V3每百万输入令牌和输出令牌定价相较于Claude-3.5等竞品相比呈现出显著的成本优势。 资料来源:DeepSeek-V3TechnicalReport,爱建证券研究所 2.DeepSeek坚定开源路线,模型效率持续提升 2.1DeepSeek基于MLA+MoE架构,持续更新迭代 DeepSeek基于MLA+MoE架构,坚定开源路线,持续更新MoE、推理、多模态模型。MLA是DeepSeek高效推理的核心,通过低秩联合压缩技术减少推理时的关键值(KV)缓存,降低实际占用内存,提升了模型处理效率;MoE是由许多专门从事不同领域的小型模型组成的大型模型,通过少量参数改变,实现降本增效。模型构造方面,DeepSeekV3坚持自研了MLA注意力机制和无辅助损失负载均衡策略的MoE架构,与DeepSeek-V2相比,无辅助损失的负载均衡策略的引用用于DeepSeekMoE,减轻因需要保证Expert负载均衡而导致的性能下降。DeepSeekV3通过共享专家,整体预训练用了14.8万亿的高质量Token,并持续更新SFT和RL,总参数量达到671B,而每个Token激活参数量仅37B,做到高效的推理和训练。 资料来源:DeepSeek-V3TechnicalReport,爱建证券研究所 2.2V3技术更新迭代,算力利用率持续攀升 DeepSeek-V3技术差异化,通过双侧推卡,减少集群训练中机器数据的等待期,提升MFU(算力利用率)。V3通过工程、算法上的优化,使模型训练、推理成本得到极大的降低。(1)架构上:采用了MOE架构(专家模型混合体)并为MOE 开创了负载平衡的无损失策略。MOE痛点在如何确定将各种类型令牌交给何类子模型或“专家”。而DeepSeek选择实施“门控网络”,在不影响性能下将令牌路由到合适专家,每个标记在训练中只需改变少量参数,效率得到提升。同时,DeepSeek研究了多tokens预测,并证明其有利于模型性能,也可以用于推理加速的推测解码。(2)预训练:首次在超大规模模型上验证了FP8训练的可行性和有效性;通过算法、框架和硬件协同设计,克服了跨节点MOE训练中的通信瓶颈,显著增强了训练效率并降低训练成本。(3)后训练:引入创新方法,将cot模型中的推理能力提炼到标准LLMs中。 DeepSeekV3相比Llama3成本控制显著,算力依赖程度低。DeepSeek仅使用2000张H800的GPU(图形处理单元)进行训练,算力的依赖小,训练成本2.788MGPU小时(多GPU计算时所消耗时间)。而Llama3405B的训练时长较高,训练成本557.6万美元(约合4070万人民币)。DeepSeek算力优化成效较大,降本增效显著。DeepSeek-R1通过重新设计训练流程、以较少的SFT数据+多轮学习强化,提高模型准确性的同时,显著降低了内存占用和计算开销。DeepSeek-V3拥有6710亿参数。实际运行中,每个输入仅激活370亿参数,大幅降低计算成本。 3.多重催化剂助力人形产业聚势 3.1AI大模型的催动 AI智能体爆发,助力AI大模型技术演进。自2024年以来,AI智能体成为AI技术 公 司 重 点 发 力 对 象 , 比 如 苹 果 的AppleIntelligence、Anthropic公 司 的ComputerUse、谷歌Jarvis、OpenAI的Operator等,2025年或将是AI智能体爆发之年。据咨询机构Gartner预测,2028年至少有15%的日常工作决策将由AI智能体自主完成。与生成式AI不同,AI智能体是目标驱动型的,能够完全执行工作流程,适应、学习、迭代、与其他系统和人类协作,并端到端地完成任务,可以看作是大模型通用操作系统(LLM-OS)的雏形。DeepSeek便是一款基于Transformer结构的语言模型,采用了多层堆叠和多头自注意力机制,以及残差连接和层归一化等技术,使得模型能够更好地捕捉语言特征和上下文信息,拥有高达670亿参数,超越了国际领先的Llama2模型,展现出了强大的性能和潜力。中观层面,DeepSeek部署浪潮下,当“国产低端芯片构建人工智能”在DeepSeek全局部署后成为现实,该预测会传导至人形机器人行业,在电车、电池领域的国产供应链自主和主导地位会蔓延至AI机器人。细分赛道上,在危险程度较高、自动化需求迫切的机器人种类会优先受益,其次是家用场景。同时,根据物流机器人落地在”最后一百米”的现实解决方案看,人形机器人在中低端市场并不会严重受到先进算力芯片管制的影响,算力“不需高质,只需大量”会在C端市场得到充分体现。按照目前TeslaOptimus最新指引,2024-2035人形机器人会率先在工业、物流、医疗以及零售等领域率先落地;2035年后会实现家用的全场 景和个性化覆盖。 3.2DeepSeek对人形机器人产业的催化 机器人:人形产业趋势逐渐明朗,自研人形整机的放量预期对其决策组成部分--FSD芯片的需求日益扩张。2024年4月,特斯拉推出多模态大模型Grok-1.5v,利用端到端高速大模型FSD推理,有望连接数字世界与物理世界,解决自动驾驶边缘案例的在线迭代学习问题。目前,特斯拉人形机器人Optimus的主控芯片采用了其自研Soc(SystemonChip),参照当前HW3(Hardware3.0)驾驶辅助系统的算力,Optimus算力为72Tops;AI训练芯片则采用了特斯拉DojoD1超级计算机芯片,每个D1单元之间无缝连接,相邻芯片之间的延迟低,训练模块实现了更大程度的带宽保留,实现了高达9千万亿次的算力。(类比智能驾驶行业,人形机器人核心壁垒在于拥有数据训练闭环体系、硬件供应链自主且拥有强悍的AI软件能力。在机器人智能侧,DeepSeek的全局部署会为"GenAI+强化学习+多 模 态 感 知”的 智 能 化 环 节 全 面 降 低 成 本 。 在 具 体 技 术 路 线 上 :1.参 照TeslaOptimusFSD的AI体系(但实际仍依赖PID+反馈控制)2.能量管理优化:利用AI预测机器人能耗,动态调整充电策略,提升定位校准能力;3.力触觉AI模型:使用CNN、RNN或Transformer处理高维触觉数据,优化物体识别和分类系统。 事件1:【DeePSeeK模型有望赋予人形机器人多模态交互和工业场景】 2月7日消息,据澎湃新闻报道,优必选正在验证DeepSeek技术在人形机器人应用场景中的有效性,包括多模态人机交互、复杂环境下的指令理解、以及工业场景中的任务分解与规划等。公司希望借助推理大模型的深度思考能力,破解这些复杂任务的挑战,使人形机器人更接近人类的思维方式和行为表现。 事件2:【DeepSeek有望提升机器人数据处理能力,推进“GPT”时刻到来】 中国的激光制造商RoboSense在2025年1月3日的“HelloRobot”在线活动中推出人形机器人组件。数据被认为是人形机器人进入“ChatGPT”或“苹果”时刻的主要瓶颈,这一领域正受到更多重视。 4.商业模式 4.1商业初衷:瞄准长尾 DeepSeek瞄准AI应用的广阔长尾领域。避开与大厂在高端技术研发,专注为中小型企业、初创团队以及特定行业提供定制化、低成本的AI解决方案。差异化竞争为其赢得了稳定的客户群体和持续的现金流。 精细化运营、简单实用的产品设计,回归商业本质和创新商业模式。DeepSeek通过精细化运营实现资源的最大化利用,公司内部从研发、采购、市场营销各环 节力求投入获取最大的价值产出。DeepSeek还积极利用开源技术、云服务等外部资源,进一步压缩成本。 4.2展望海外平台盈利模式 核心观点:纵观海外具身智能大模型,我们认为DeepSeek可能会参考对标海外机器人和大模型头部公司的盈利路径。(1)参考英伟达人形机器人通用基础模型ProjectGR00T,在实现人形机器人端到端部署后构建粘性更高的机器人B端用户平台。(2)参照Figure机器人路径,DeepSeek帮助B端用户构建自研多模态。 NVIDIAIsaacGR00T以技术授权、云服务、硬件支持、构建机器人生态为盈利模式。IsaacGR00T是NVID