您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [太平洋证券]:计算机行业周报(20250707-20250713):Grok 4 发布,模型底座能力更近一步 - 发现报告

计算机行业周报(20250707-20250713):Grok 4 发布,模型底座能力更近一步

信息技术 2025-07-13 曹佩 太平洋证券 Michael Wong 香港继承教育
报告封面

报告摘要行情回顾:本周(2025.7.7-2025.7.11)申万计算机行业指数上涨3.22%,在31个申万一级行业中排名第6位。截至本周五(7月11日),计算机行业指数与较年初上涨9.75%,跑赢沪深300指数7.72pct。7月10日,xAI发布新一代大模型Grok 4系列。Grok 4系列包括Grok4和Grok 4 Heavy两个版本,Grok 4为单智能体模型,Grok 4Heavy为多智能体的升级版,可支持4个agent同时工作。Grok 4系列推理能力大幅提升,在多个基准测试中刷新行业SOTA。Grok4系列在各项专业学科基准测试中表现大幅领先,在知识能力上已经超越研究生水平。在HLE(Humanities Last Exam,由各学科专家编写的高难度学术测试集)测试中,在使用工具的情况下,Grok 4的成绩为38.6%,Grok 4 Heavy的成绩为44.4%,大幅超越o3和Gemini 2.5Pro。如果在推理阶段增加算力投入并使用工具,则分数进一步提升至50.7%。在AIME25、GPQA、HMMT25等其他权威基准测试方面,Grok 4 Heavy均超越其他此前最先进的模型夺冠。Grok展现出较强的解决复杂现实任务的能力。在衡量复杂任务解决能力的商业环境测试Vending-Bench中,Grok-4模拟经营取得的利润是第二名Claude Opus 4的两倍。在游戏领域,Grok-4可以设计和构建视频游戏,包括资源获取、写代码等,研究人员用4个小时制作出一款第一人称射击游戏。此外,Grok 4在生物医药、金融等领域也取得较大突破。Grok4性能的大幅提升主要来源于算力投入的大幅增长,以及在训练阶段引入工具使用。Grok-4在xAI建设的20万卡集群Colossus上运行强化学习训练,其训练量是Grok-2的100倍、Grok-3的10倍。Grok4Heavy通过提高强化学习阶段的算力投入以提升模型效果。Grok 4特别强调了在后训练过程中原生融入工具,比如在“人类最后考试HLE”上,在后训练中融入工具,不仅比不使用工具能取得更高分数,而且Scaling提升效率也更高。即增加同样的计算资源,工具融入训练能带来更高智能。投资建议:xAI新发布的模型进一步加强了基座模型能力,有望加速AI应用落地。重点推荐金山办公、用友网络、赛意信息、熵基科技、云从科技等,AI应用的发展也会促进基础设施的发展,重点推荐海光信息、智微智能、联想集团等。风险提示:AI技术发展不及预期,市场竞争加剧。24/9/2524/12/625/2/1625/4/2925/7/10计算机沪深300 守正出奇宁静致远 请务必阅读正文之后的免责条款部分目录一、Grok 4模型发布,推理能力大幅提升..............................................4二、行情回顾......................................................................8三、投资建议......................................................................9四、风险提示......................................................................9 守正出奇宁静致远 请务必阅读正文之后的免责条款部分图表目录图表1:Grok 4和Grok 4 Heavy在HLE测试中的表现......................................4图表2:Grok 4系列在多项基准测试中取得SOTA..........................................5图表3:Grok在Vending-Bench测试中大幅领先于其他模型.................................5图表4:Grok性能随着计算量提升得到指数级增长.........................................6图表5:在后训练阶段引入工具使模型性能提升...........................................7图表6:目前主流模型API输入/输出价格................................................7图表7:xAI模型发布计划.............................................................8图表8:申万一级行业周涨幅(7.7-7.11)...............................................8图表9:申万计算机指数和沪深300指数年初至今涨跌幅(截至7.11).......................8图表10:本周计算机行业涨跌幅前五....................................................9 守正出奇宁静致远 请务必阅读正文之后的免责条款部分一、Grok 4模型发布,推理能力大幅提升北京时间7月10日,xAI直播发布新一代大模型——Grok 4系列。Grok 4系列包括Grok 4和Grok 4 Heavy两个版本,Grok 4为单智能体模型,Grok 4 Heavy为多智能体的升级版,可支持4个agent同时工作。Grok 4系列推理能力大幅提升,在多个基准测试中刷新行业SOTA。Grok为首个在HLE基准测试中突破50%准确率的模型。在HLE(Humanities Last Exam,由各学科专家编写的高难度学术测试集)测试中,在使用工具的情况下,Grok 4的成绩为38.6%,Grok 4 Heavy的成绩进一步提升至44.4%,大幅超越o3和Gemini 2.5 Pro。如果在推理阶段增加算力投入并使用工具,则HLE的分数还能进一步提升到50.7%。图表1:Grok4和Grok 4 Heavy在HLE测试中的表现在其他权威基准测试方面,包括GPQA(研究生级别的Google验证问答基准测试)、AIME25(美国数学竞赛邀请赛)、LCB(Jan-May)(编程竞赛/在线算法竞赛)、HMMT25(高中生团队数学竞赛)和USAMO25(美国顶级高中生数学竞赛),Grok 4 Heavy均超越其他此前最先进的模型模型夺冠。 守正出奇宁静致远资料来源:xAI,太平洋证券整理 守正出奇宁静致远资料来源:机器之心,xAI,太平洋证券整理Grok展现出较强的解决复杂现实任务的能力。在衡量复杂任务解决能力的商业环境测试Vending-Bench中,Grok-4模拟经营取得的利润是第二名Claude Opus 4的两倍。在游戏领域,Grok-4可以设计和构建视频游戏,包括资源获取、写代码等,研究人员用4个小时制作出一款第一人称射击游戏。此外,Grok4在生物医药、金融等领域也取得较大突破。图表3:Grok在Vending-Bench测试中大幅领先于其他模型资料来源:机器之心,xAI,太平洋证券整理 请务必阅读正文之后的免责条款部分 请务必阅读正文之后的免责条款部分守正出奇宁静致远Grok性能的持续提升得益于算力投入的大幅增长。Grok-4在xAI建设的20万卡集群Colossus上运行强化学习训练,其训练量是Grok-2的100倍、Grok-3的10倍。Grok 4 Heavy通过提高强化学习阶段的算力投入以提升模型效果。图表4:Grok性能随着计算量提升得到指数级增长资料来源:机器之心,xAI,太平洋证券整理Grok4在后训练过程中融入工具使用,提升性能表现。Grok 4特别强调了在后训练过程中原生融入工具,并通过多项结果对比论证其有效性。比如在“人类最后考试HLE”上,在后训练中融入工具,不仅比不使用工具能取得更高分数,而且Scaling提升效率也更高。即增加同样的计算资源,工具融入训练能带来更高智能。 守正出奇宁静致远资料来源:机器之心,xAI,太平洋证券整理价格方面,目前Grok-4仅面向付费用户,个人订阅使用Grok 4定价为30美元/月,Grok-4Heavy版本则需要300美元/月;API定价为输入3美元/百万Tokens,输出15美元/百万Tokens,资料来源:Artificial Analysis,太平洋证券整理Grok4在多模态能力方面有待提升,后续将重点改进。Grok 4目前在图像理解和生成上仍落后于OpenAI、Anthropic等对手,xAI表示,下一代基础模型将强化图像和音频理解,接着是视频生成。后续xAI计划在8月发布代码模型,9月发布多模态智能体,10月发布视频生成模型。 请务必阅读正文之后的免责条款部分较o3大约贵50%。图表6:目前主流模型API输入/输出价格 守正出奇宁静致远资料来源:xAI,太平洋证券整理本周申万计算机行业指数上涨3.22%,在31个申万一级行业中排名第6位。截至本周五(7月11日),计算机行业指数与较年初上涨9.75%,跑赢沪深300指数7.72pct。图表9:申万计算机指数和沪深300指数年初至今涨资料来源:iFinD,太平洋证券整理本周计算机行业涨幅前五的公司分别为普联软件(+44.38%)、大智慧(+42.52%)、上海钢联(+26.62%)、博睿数据(+22.86%)、中船汉光(+22.01%);跌幅前五的公司分别为ST华铭(-16.04%)、*ST汇科(-14.42%)、汇金股份(-12.68%)、税友股份(-8.68%)、正元智慧(-8.07%)。 请务必阅读正文之后的免责条款部分二、行情回顾图表8:申万一级行业周涨幅(7.7-7.11)资料来源:iFinD,太平洋证券整理 跌幅(截至7.11) 请务必阅读正文之后的免责条款部分三、投资建议xAI新发布的模型进一步加强了基座模型能力,有望加速AI应用落地。重点推荐金山办公、用友网络、赛意信息、熵基科技、云从科技等,AI应用的发展也会促进基础设施的发展,重点推荐海光信息、智微智能、联想集团等。四、风险提示AI技术发展不及预期,市场竞争加剧。 守正出奇宁静致远 请务必阅读正文之后的免责条款部分投资评级说明1、行业评级看好:预计未来6个月内,行业整体回报高于沪深300指数5%以上;中性:预计未来6个月内,行业整体回报介于沪深300指数-5%与5%之间;看淡:预计未来6个月内,行业整体回报低于沪深300指数5%以下。2、公司评级买入:预计未来6个月内,个股相对沪深300指数涨幅在15%以上;增持:预计未来6个月内,个股相对沪深300指数涨幅介于5%与15%之间;持有:预计未来6个月内,个股相对沪深300指数涨幅介于-5%与5%之间;减持:预计未来6个月内,个股相对沪深300指数涨幅介于-5%与-15%之间;卖出:预计未来6个月内,个股相对沪深300指数涨幅低于-15%以下。太平洋证券股份有限公司云南省昆明市盘龙区北京路926号同德广场写字楼31楼 守正出奇宁静致远 研究院中国北京100044北京市西城区北展北街九号华远·企业号D座投诉电话:95397投诉邮箱:kefu@tpyzq.com太平洋证券股份有限公司(以下简称“我公司”或“太平洋证券”)具备中国证券监督管理委员本报告仅向与太平洋证券签署服务协议的签约客户发布,为太平洋证券签约客户的专属研究产品,若您并非太平洋证券签约客户,请取消接收、订阅或使用本报告中的任何信息;太平洋证券不会因接收人收到、阅读或关注媒体推送本报告中的内容而视其为太平洋证券的客户。在任何情况下,本报告中的信息或所表述的意见并不构成对任何机构和个人的投资建议,投资者应自主作出投资决策并自行承担投资风险,任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无本报告信息均来源于公开资料,我公司对这些信息的准确性