您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华鑫证券]:计算机行业周报:全球首个混合推理模型Claude 3.7 Sonnet发布,高情商模型GPT-4.5问世 - 发现报告

计算机行业周报:全球首个混合推理模型Claude 3.7 Sonnet发布,高情商模型GPT-4.5问世

信息技术2025-03-04宝幼琛华鑫证券表***
AI智能总结
查看更多
计算机行业周报:全球首个混合推理模型Claude 3.7 Sonnet发布,高情商模型GPT-4.5问世

全球首个混合推理模型Claude 3.7 Sonnet发布,高情商模型GPT-4.5问世 —计算机行业周报 投资要点 推荐(维持) ▌算力:恒源云13核+128G算力紧张 分析师:宝幼琛S1050521110002baoyc@cfsc.com.cn 本周恒源云13核+128G算力紧张。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G算力紧张;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G价格为9.00元/时。 ▌AI应 用 :全 球 首 个 混 合 推 理 模 型Claude 3.7Sonnet发布,OpenAI推出“高情商”模型GPT-4.5 2月25日,Claude 3.7 Sonnet正式发布,是全球首款双模式混合推理模型,标准模式快速响应,扩展思考模式进行深度自我反思,在数学、物理和编程等复杂任务上表现卓越,注重实用导向,不必要拒绝减少45%,强化代码协作能力。 在标准模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升级版;切换到扩展思考(Extended Thinking)模式(可简单理解为推理),它会在回答前进行自我反思,大幅提升在数学、物理、指令理解和编程等复杂任务上的表现。从基准测试结果来看,Claude 3.7 Sonnet(扩展思维版)适用于强逻辑推理和数学任务,而Grok 3 Beta和DeepSeek R1则在特定任务(推理、数学竞赛)上表现更佳。 资料来源:Wind,华鑫证券研究 相关研究 1、《计算机行业周报:微软全球首个拓扑量子处理器惊艳亮相,Grok3推理能力登顶》2025-02-232、《计算机行业点评报告:亚马逊(AMZN.O):2024Q4财报超预期,多业务协同驱动增长》2025-02-173、《计算机行业点评报告:安费诺(APH):2024年业绩创纪录,多元业务助力增长》2025-02-17 在推理模型的优化过程中,Anthropic减少了对数学和计算机科学竞赛问题的侧重,更专注于满足企业对LLM的实际应用需求。在评估AI解决真实软件问题能力的SWE-benchVerified基准测试中,Claude 3.7 Sonnet达到了行业领先水平。同时,该模型在TAU-bench测试中也表现不错,准确度超过旧版本和OpenAI o1。 另外,Claude 3.7 Sonnet在Anthropic内部的Pokémon游戏测试中超越了所有前代模型,展现了更强的决策与规划能力。该模型现已适用于所有Claude订阅计划,包括免费版、专业版、团队版和企业版,同时也可通过AnthropicAPI、Amazon Bedrock和Google Cloud的Vertex AI访问。 北京时间2月28日凌晨,美国OpenAI公司推出GPT-4.5模型(代号Orion),这是该公司有史以来算力和数据规模最 大、最佳的AI基 座 模型,本周将面向 每 月200美元的ChatGPT Pro用户开放,下周向ChatGPT Plus开放。OpenAI表示,GPT-4.5在预训练和后训练的扩展上取得进展,通过扩展无监督学习提升了模式识别等能力。 能力提升方面,与GPT-4o相比,GPT-4.5在传统的LLM基准测试中取得了明显进步。在GBQA(数学等推理任务评估)、AME(数学竞赛评估)、SWE-Bench Verified(编码评估),以及MMMLU(多语言理解)和MMMU(多模态理解)等主流评测基准上,GPT-4.5均超过GPT-4o,成为目前最强大的GPT模型。但在前述多个测试,它仍然落后于深度推理模型o3Mini,仅在MMMLU和SWE-Lancer(世界知识的编码评估)测试上,GPT-4.5优于o3 Mini,显示了无监督学习与推理规模扩展的互补性。 在与人类测试者的对比评估中,GPT-4.5在创意智能、专业查询和日常查询方面相比4o有更高胜率,表现出更强的审美直觉和创造力,在日常查询当中能够达到57%,专业查询达63.2%,“情商”更高。此外,虽然GPT-4.5没有深度思考,但未来推理将成模型核心能力,所以GPT-4.5采用预训练和推理两种扩展方法相互补充。 此外,OpenAI会向所有付费级别的开发者发布GPT-4.5,支持函数调用、结构化输出等功能。这也是OpenAI有史以来最贵的模型,API价格为每百万Token输入75美元,每百万输出150美元,价格昂贵。对比来看,同等Token规模下,GPT-4o输入输出分别仅需2.5/10美元,Claude 3.7 Sonnet分别为3美元 和15美元;DeepSeek-V3输出是8元,DeepSeek-R1输出则是16元(标准时段)。这意味着,GPT-4.5的API输出价格为DeepSeek-V3的130多倍、DeepSeek-R1的70倍。 ▌AI融资动向:Anthropic融资规模扩大至35亿美元,估值达615亿美元 人工智能初创公司Anthropic正在完成一轮新的融资,该轮融资规模已从最初计划的20亿美元增至35亿美元。这轮融资将使公司的估值达到615亿美元。参与本次融资的投资者包括Lightspeed Venture Partners、General Catalyst、Bessemer Venture Partners以及总部位于阿布扎比的投资公司MGX等。若融资成功完成,Anthropic的总融资额将达到约180亿美元。尽管Anthropic的年化收入约为12亿美元,但公司目前仍在亏损。该公司表示,将利用此次融资所得加大对更先进AI技术的研发投入。Anthropic以其人工智能聊天机器人Claude而闻名,日前发布了其最新的旗舰AI模型Claude 3.7 Sonnet,并称其为公司迄今为止“最智能”的版本。这款模型最大的特点在于其“混合”模式,它结 合 了 推 理 能 力 和 实 时 输 出 答 案 的 传 统 模 型 的 优 势 。 Anthropic声称其是市场上唯一一款此类“混合”模型,并且已立即上线,此前他们也是第一个推出广泛可用的“代理”功能的公司。目前,AI领域竞争激烈,各家公司都在大力投资AI模型。Anthropic此举旨在对抗竞争对手OpenAI和谷歌等大型科技公司。 ▌投资建议 2月24日至28日,DeepSeek连续开源五项代码库,覆盖计算、通信与存储等关键领域。此举显著降低AI技术门槛,使创业公司仅需数十张显卡即可开发对标谷歌、Meta的模型,推动AI技术进入“平权时代”。3月1日,其发布的V3/R1推理系统基于H800GPU运行,通过动态负载分配机制实现成本效率优化至545%,进一步缩小大企业与中小开发者的资源差距。同时,2025年世界移动通信大会(MWC)即将揭幕,华为将在MWC2025展示全场景5G-A产品,中兴通讯则联合中国移动、中国联通等发布5G-AxAI创新成果,包括业界首个C+L一体化80x800GWDM现网试点。DeepSeek等公司通过技术共享降低研发成本,促使更多国家参与AI生态建设。MWC展会的技术展示将进一步强化5G-A与AI协同效应,为通信行业开辟新增长空间。 建 议 关 注 临 床AI产 品 成 功 落 地 验 证 的 嘉 和 美 康(688246.SH) 、 以AI为 核 心 的 龙 头 厂 商 科 大 讯 飞(002230.SZ) 、 芯 片 技 术 有 望 创 新 突 破 的 寒 武 纪(688256.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。 ▌风险提示 1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。 正文目录 1、算力动态:恒源云13核+128G算力紧张....................................................61.1、数据跟踪:恒源云13核+128G算力紧张..............................................62、AI应用动态:全球首个混合推理模型CLAUDE 3.7 SONNET发布,“高情商”模型GPT-4.5发布....72.1、流量跟踪:Perplexity搜索访问量环比+6.06%........................................72.2、产业动态:全球首个混合推理模型Claude 3.7 Sonnet发布,OpenAI推出“高情商”模型GPT-4.5......................................................................................73、AI融资动向:ANTHROPIC融资规模扩大至35亿美元,估值达615亿美元.....................114、行情复盘...............................................................................125、投资建议...............................................................................146、风险提示...............................................................................14 图表目录 图表1:本周算力租赁情况...............................................................6图表2:2025.2.24-2025.2.28 AI相关网站流量.............................................7图表3:基准测试结果...................................................................8图表4:SWE-bench Verified基准测试结果................................................8图表5:TAU-bench测试结果.............................................................9图表6:Pokémon游戏测试结果..........................................................9图表7:GPT-4.5在多方面评测中均领先于GPT-4o...........................................10图表8:本周AI初创公司融资动态........................................................11图表9:本周指数日涨跌幅...............................................................12图表10:本周AI算力指数内部涨跌幅度排名...............................................12图表11:本周AI应用指数内部涨跌幅度