您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华鑫证券]:计算机行业周报:LLaDA2.1实现技术突破,Gemini3.1Pro树立多模态新标准 - 发现报告

计算机行业周报:LLaDA2.1实现技术突破,Gemini3.1Pro树立多模态新标准

信息技术2026-02-25任春阳华鑫证券G***
AI智能总结
查看更多
计算机行业周报:LLaDA2.1实现技术突破,Gemini3.1Pro树立多模态新标准

LLaDA2.1实现技术突破,Gemini3.1Pro树立多模态新标准 —计 算 机行 业 周 报 投资要点 推荐(维持) ▌算 力 : 算 力 租 赁 价 格 平 稳 , 扩 散 语 言 模 型LLaDA2.1实现技术突破 分析师:任春阳S1050521110006rency@cfsc.com.cn 2026年2月,LLaDA2.1扩散语言模型正式发布,含160亿、千 亿 参 数 两 个 版 本 , 其 中 千 亿 版 在 复 杂 编 程 测 试 中 实 现892Tokens/秒峰值速度。该模型通过三大技术创新破解速度与质量平衡难题,实验证明其在性能和效率上双重提升。 行 业 相 对 表 现 ▌AI应 用 :Gemini周 访 问 量 环 比+4.31%,Gemini3.1Pro树立多模态新标准 2026年2月20日,谷歌DeepMind发布了其下一代旗舰模型Gemini3.1Pro,这一模型在多个领域实现了技术突破,迅速成为人工智能领域的新标杆,尤其在推理能力表现突出。Gemini3.1Pro在ARC-AGI-2测试中取得了77.1%的高分,性能提升至上一代3.0Pro的两倍有余,同时在ARC-AGI-1测试中也接近满分,超越了包括ClaudeOpus4.6和GPT-5.2在内的多个竞争对手。 ▌AI融资动向:WorldLabs完成10亿美元新一轮融资 相 关 研 究 2026年2月,李飞飞创立的WorldLabs完成10亿美元新一轮融资,AMD、英伟达、Autodesk等参投,Autodesk单独投2亿美元并展开合作,公司此前谈判估值约50亿美元,资金将用于空间智能领域研发。该公司聚焦大型世界模型,旗舰产品Marble可多模态生成高保真3D世界,适用于媒体娱乐、机器人训练等场景。 1、《计算机行业周报:字节跳动Seedance2.0重磅上线,ClaudeOpus4.6发布》2026-02-102、《计算机行业点评报告:亚马逊(AMZN.O):AI基础设施与零售网络共振,资本开支周期驱动长期增长》2026-02-083、《计算机行业点评报告:苹果(AAPL.O) : 营 收 利 润 双 增 长 ,iPhone与服务业务表现亮眼创历史新高》2026-02-05 ▌投资建议 2026年2月20日,Anthropic推出了AI驱动的安全工具ClaudeCodeSecurity。该工具通过结合自动化的速度与人工的分析方式,帮助开发者应对AI时代日益严峻的网络安全风险。与仅依赖已知漏洞模式的传统分析工具不同, ClaudeCodeSecurity能够像资深安全工程师一样,理清代码组件的交互与数据流动,从而捕获业务逻辑缺陷、访问控制失效等较为复杂的漏洞。其每项发现都会经过多阶段验证流程,通过充分的举证质证来过滤误报,并提供置信度与严重性评级,以便团队优先处理最关键的问题。目前,该工具已面向企业版和团队版客户开放有限研究预览版,开源维护者 也可申请免费快速访问权限。此次Anthropic新的工具发布代表着AI应用逐步开始融入并重塑企业核心的业务流程,其逐渐从原先的辅助工具转向实际商业化落地。我们认为AI应用的下一阶段是行业深度定制,当前通用大模型正向垂直行业工具渗透,以解决特定痛点。在此过程中,拥有行业数据壁垒的企业将构筑显著优势,它们能够将通用大模型私有化,构建起与业务深度绑定、难以被通用模型复制的Agent。基于此,我们维持对AI应用垂直领域板块的看好。中长期,建议关注加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ),AI智能文字识别与商业大数据领域巨头的合合信息(688615.SH)、深耕工业AI与软件并长期服务高端装备等领域头部客户的能科科技(603859.SH)。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 正文目录 1、算力动态:算力租赁价格平稳,扩散语言模型LLADA2.1实现技术突破............................41.1、Tokens跟踪........................................................................41.2、数据跟踪:算力租赁价格平稳........................................................51.3、产业动态:扩散语言模型LLaDA2.1实现技术突破.......................................52、AI应用动态:GEMINI周访问量环比+4.31%,GEMINI3.1PRO树立多模态新标准.....................82.1、周流量跟踪:Gemini周访问量环比+4.31%..............................................82.2、产业动态:百万上下文与低幻觉率兼备,Gemini3.1Pro树立多模态新标准..................83、AI融资动向:WORLDLABS完成10亿美元新一轮融资...........................................124、投资建议...............................................................................145、风险提示...............................................................................14 图表目录 图表1:TOKENS规模LEADERBOARD..............................................................4图表2:市场份额占据示意....................................................................4图表3:上周算力租赁情况....................................................................5图表4:论文联合发表示意图..................................................................5图表5:BENCHMARK表现对比结果示意图.........................................................6图表6:TPS结果对比示意图...................................................................7图表7:2026.2.15-2026.2.21AI相关网站流量...................................................8图表8:GEMINI3.1PRO在ARC-AGI-1测试和ARC-AGI-2测试中的表现................................9图表9:GEMINI3.1PRO在APEX-AGENTS智能体任务中的表现........................................9图表10:GEMINI3.1PRO在多项测试中的表现....................................................10图表11:GEMINI3.1PRO在AA-OMNISCIENCE幻觉率评估中的表现...................................10图表12:上周AI初创公司融资动态...........................................................12图表13:重点关注公司及盈利预测............................................................14 1、算力动态:算力租赁价格平稳,扩散语言模型LLaDA2.1实现技术突破 1.1、Tokens跟踪 根据OpenRouter公开数据,2026年2月16日至2026年2月22日,周度token消耗量有所上升,调用量为14T,环比上周7.69%。在tokens规模leaderboard前五名中,minimax旗下的MiniMax2.5以2.57Ttokens位居榜首;moonshotai的KimiK2.5以1.04T位列第二;Google的Gemini3FlashPreview以859Btokens位居第三;z-ai的GLM以803B排第四;Deepseek的DeepseekV3.2以745Btokens位列第五。 从市场份额维度来看,Google以825Btokens占据18.9%的份额,稳居首位;Anthropic以644B占据14.8%,位列第二;Minimax、OpenAI、z-AI则分别以632B、412B、371Btokens,对应占据14.5%、9.5%、8.5%的市场份额。 资料来源:OpenRouter,华鑫证券研究 资料来源:OpenRouter,华鑫证券研究 1.2、数据跟踪:算力租赁价格平稳 上周算力租赁价格平稳。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;A800-80G价格为7.50元/时。 1.3、产业动态:扩散语言模型LLaDA2.1实现技术突破 2026年2月,扩散语言模型LLaDA2.1在HuggingFace平台正式发布,本次发布的LLaDA2.1包含160亿参数的Mini版本与1000亿参数的Flash版本,其中1000亿参数版本在HumanEval+复杂编程基准测试中实现892Tokens/秒的峰值推理速度,突破了扩散语言模型的规模天花板,为大语言模型发展提供了自回归架构之外的全新可行路径。 资料来源:机器之心,华鑫证券研究 当前主流大语言模型均采用自回归架构,遵循逐Token串行生成的模式,虽具备稳定性优势,但存在推理速度慢、计算成本高、生成错误无法回溯修正等问题,其串行解码的本质难以实现效率的量级提升,成为规模化应用的重要制约。 LLaDA2.1的核心技术突破体现在三大方面。其一,创新提出可纠错编辑机制(ECE),颠覆了自回归模型的生成模式,让模型实现类人类的“起草-编辑”生成逻辑:先以极高速度并行生成内容草稿,再对草稿进行全局重新评估与智能修正,可及时回溯修改错误、替换更优表达,有效解决了并行解码中的局部不一致性问题,同时将时延与生成质量的刚性权衡转化为可灵活配置的空间,在不牺牲质量的前提下大幅提升生成效率。其二,首创单模型双模式设计,支持极速模式(SpeedyMode)与质量模式(QualityMode)灵活切换,用户仅需一条配置指令即可根据场景需求选择:极速模式通过降低初始生成置信度阈值实现快速产出,适配代码生成、头脑风暴等对效率要求较高的场景;质量模式以保守策略提升初始生成质量,减少修正需求,适用于正式文档、学术写作、高精度任务等场景,相较于此前需开发多个加速版本的模式,大幅降低了用户选择与模型管理成本。其三,首次将强化学习成功应用于百亿参数级扩散模型,针对序列级对数似然难以精确计算的行业难题,提出基于ELBO的块级策略优化方法(EBPO),专门适配可编辑解码结构,让模型在提升速度的同时,更好地理解人类指令、对齐人类意图,进一步增强了模型的实用性与可靠性。 实验评估结果显示,LLaDA2.