您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:计算机行业研究周报:一切仍然指向算力 - 发现报告

计算机行业研究周报:一切仍然指向算力

信息技术2025-12-28郑元昊国金证券陈***
计算机行业研究周报:一切仍然指向算力

本周观点 大模型竞赛持续白热化,Scaling law依旧有效。全球顶尖大模型持续突破,谷歌Gemini 3在基础推理与多模态能力上实现跃迁式提升,OpenAI GPT-5.2面向 专业知识型工作,凸显大模型在创造经济价值方面的潜力。Meta正积极开发两款重量级AI模型,分别是主攻图像与影片的Mango,以及强化编程能力的Avocado。国产开源模型DeepSeek-V3.2在推理性能上逼近顶尖闭源模型,其稀疏注意力(DSA)、高比例后训练和大规模合成数据等方面的创新,证明算法与训练范式仍具巨大突破空间。12月16日斯坦福大学报告指出,在能力与采用率方面,中国开放权重的大模型已接近甚至部分领先于国际先进水平。综合来看Scaling Law依然有效,模型能力尚未触及瓶颈。随着英伟达Blackwell架构带来训练算力底座升级,2026年大模型进展值得期待。AI应用落地加速,推理需求持续强化。 字节跳动于12月发布豆包AI手机助手技术预览版,实现AI对手机的跨应用自主操作,从理解指令升级为执行 复杂任务,预示着手机交互方式重塑。2025年5月底豆包大模型日均tokens使用量超过16.4万亿,2025年12月豆包大模型日均Tokens使用量已突破50万亿。应用落地的推理需求预依旧高速增长。 近期英伟达从推理芯片初创公司Groq获得关键技术授权,并吸纳其核心高管,显示英伟达在保持训练算力主导地位的同时,正加速向推理市场纵深布局。Groq采用基于SRAM的LPU架构专为推理设计,估值69亿美元。我们认为该合作反映出AI算力需求正由以训练为中心向训练+大规模推理并重演进,印证大模型应用落地节奏加快、商业化前景乐观。“十五五”规划建议发布,新兴产业和未来产业布局愈发清晰。 “十五五”规划建议明确提出支持航空航天等战略性新兴产业发展,前瞻布局未来产业量子科技、生物制造、氢 能和核聚变能、脑机接口、具身智能、第六代移动通信等,算力基建方面,提出适度超前建设新型基础设施,推进信息通信网络、全国一体化算力网、重大科技基础设施等建设。无论是产业进展还是政策导向,都在坚定我们对AI时代的信仰和一切仍然指向算力的判断。投资建议 相关标的: 算力:寒武纪、海光信息、东阳光、神州数码、新易盛、中际旭创、中芯国际、华虹半导体、胜宏科技、品高股份、鸿腾精密科技、有方科技、协创数据、沪电股份、兴森科技、中科曙光、浪潮信息、东山精密、云天励飞、伟仕佳杰、宏景科技、中芯国际、奥飞数据、云赛智联、科华数据、禾盛新材、潍柴重机、金山云、浙数文化、青云科技、大位科技、玉柴国际、亿田智能、弘信电子、圣阳股份、润泽科技、润建股份、深桑达、优刻得、云从科技、太极股份、数据港、首都在线。Agent:谷歌、阿里巴巴、腾讯控股、阜博集团、广立微、第四范式、汇量科技、金蝶国际、拓尔思、合合信息、 税友股份、新致软件、金桥信息、快手、美图公司、鼎捷数智、慧辰股份、嘉和美康、海天瑞声、泛微网络、朗新集团、润达医疗、壹网壹创、万兴科技、用友网络、麦迪科技、宇信科技、京北方、中科金财、致远互联、汉得信息、软通动力、光云科技、上海钢联、同花顺、信雅达、萤石网络、迪安诊断、中科金财、恒生电子、星环科技、东软集团、卫宁健康、创业慧康、科大讯飞、万兴科技、创业黑马、迈富时、小商品城、金证股份、顶点软件、朗新集团、晶泰控股、佳发教育、新大陆、新开普等。自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等。 军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图等。 风险提示 行业竞争加剧的风险;技术研发进度不及预期的风险;特定行业下游资本开支周期性波动的风险。 内容目录 一、大模型竞赛持续白热化,Scaling law依旧有效.................................................31.1顶尖模型持续迭代.......................................................................31.2算力基座更迭,2026年模型进展更精彩.....................................................5二、AI应用落地加速,推理需求持续强化..........................................................62.1字节AI手机发布,应用落地趋势更加显化...................................................62.2英伟达前瞻布局推理算力,彰显AI应用落地乐观预期.........................................7...............................................................................................8三、“十五五”规划建议发布,新兴产业和未来产业布局愈发清晰........................................8四、相关标的...................................................................................8风险提示.......................................................................................9 图表目录 图表1:Gemini 3在多项评分基准大幅领先........................................................3图表2:Hugging Face上主要开源权重LLMs的累积下载量........................................5图表3:ChatBot Arena中得分最高的开源权重模型,截止12月4日..................................5图表4:Hopper (H100)与Blackwell(B200/GB300)对比............................................6图表5:豆包手机助手执行用户任务..............................................................7图表6:Groq的芯片专为推理设计...............................................................8 一、大模型竞赛持续白热化,Scaling law依旧有效 1.1顶尖模型持续迭代 2025年11月19日谷歌Gemini 3发布,跃进式的得分提升、强大的多模态理解力、更加多样化的UI、惊艳的前端能力,让大模型的进展迈出显著一步。 基础思考能力上,Humanity's Last Exam是衡量AI能否解决人类顶尖难题的终极试金石。在Gemini 3之前,Gemini 2.5 Pro的得分是21.6%,Claude Sonnet 4.5仅为13.7%。Gemini 3Pro交出的答卷是37.5%(无工具)和45.8%(带工具)。ARC-AGI-2测试,旨在衡量模型处理从未见过的新颖推理任务的能力,而非死记硬背。Gemini 3 Pro拿下了31.1%的分数,而GPT-5.1仅为17.6%,Gemini 2.5 Pro甚至只有4.9%。这意味着它开始展现出一种接近人类的流体智力,能够在没有大量训练数据覆盖的领域进行抽象推理。 在多模态领域Gemini 3尤其惊艳,MMMU-Pro的81.0%,CharXiv Reasoning的81.4%都超越了对手。而在理解截图的测试ScreenSpot-Pro的72.7%中,Gemini 3的得分是ClaudeSonnet 4.5的两倍,GPT-5.1的二十倍。这对于构建能够真正理解和操作图形界面的AI代理至关重要。 2025年12月11日OpenAI发布GPT-5.2,为专业工作设计的顶尖模型。 GPT-5.2旨在为人们带来更多经济价值。该模型在制作电子表格、设计演示文稿、编写代码、识别图像、理解长文本上下文、使用工具以及处理复杂的多步骤项目方面表现更佳。 GDPval评测是一项覆盖44个职业、用于衡量明确知识型工作任务的评估。在GDPval测试中,模型尝试完成定义明确的知识型工作,内容涵盖美国GDP贡献度最高的9个行业中的44种职业。任务要求生成真实的工作成果,例如销售演示文稿、会计表格、急诊排班表、制造业图表或短视频。根据人类专家评审的结果,GPT-5.2 Thinking在70.7%的高难度知识型工作任务上,表现优于行业顶尖专家,或与其持平。这些任务包括制作演示文稿、电子表格以及其他专业产出。GPT-5.2 Thinking完成任务的速度大约是专家的3倍,而成本只有大约 1%。 Meta双模型布局:Mango专攻影片、Avocado强化coding。 据12月20日Inside报道,Meta正积极开发两款重量级AI模型,分别是主攻图像与影片的“Mango”,以及强化编程能力的文字模型“Avocado”,预计2026年上半年问世。我们认为海外除了谷歌、OpenAI和Anthropic外,Meta和XAI也都是值得期待的大模型核心玩家,为了在AI竞赛中抢得先机,Meta今年夏天大规模重组团队,成立由Alexandr领军的MetaSuperintelligence Labs。扎克伯格更亲自出马从OpenAI挖角超过20位研究员,组成了超过50人的精英团队,彰显其对大模型的坚定投入决心。 12月1日DeepSeek-V3.2正式版发布,国产模型引领开源创新。 在公开的推理类Benchmark测试中,DeepSeek-V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;DeepSeek-V3.2-Speciale是DeepSeek-V3.2的长思考增强版,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro,成功斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。 DeepSeek V3.2系列模型提出多项创新:延续使用DSA稀疏注意力机制、加码后训练、大规模合成数据。 DSA全称DeepSeek Sparse Attention,旨在降低计算复杂度,同时在上下文场景中还能保持模型性能。举个例子,当你面前有一本超厚的书(假设页数上万页),现在需要从这本书里查询特定信息,要求只能一页一页地看,且需要记忆看过的内容,这就是传统AI模型处理长文本时的困境——计算量随文本长度呈平方级增长。而DSA的作用如同将这种“大海捞针”的方式转为“精准定位”,不是每页都要看,而是能够只关注与目标信息最相关的几页,大幅提升了模型记忆与理解效率 此外,DeepSeek意识到开源模型的后训练投入普遍不足,限制了模型任务表现,于是采用更激进的方式,将后训练算力预算调整到超过预训练成本的10%。 DeepSeek这次用到了大规模智能体数据合成,根本原因在于缺乏足够多样化的真实训练环境,无法让智能体具备任务泛化能力。从测试评估结果看,使用合成数据使模型泛化能力提升显著。 12月16日斯坦福大学发布研究报告指出,在能力与采用率方面,中国的AI模型尤其是开放权重的大语言模型,已接近甚至部分领先于国际先进水平。 2025年9月,阿里巴巴的Qwen模型家