行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI要闻周报：QwQ-32b媲美DeepSeek-R1-671b，Manus引发智能体浪潮

2025-03-10 肖承志,冯昱文中邮证券 Silent

AI重点要闻

字节旗下AIIDETrae发布国内版

字节海外发布的AI原生集成开发环境Trae于3月3日上线国内版，内置豆包1.5Pro大模型，支持DeepSeekR1/V3模型。
核心功能：AI驱动的智能编程、多模态交互、全场景开发支持、低门槛与跨平台兼容。
目标：AI辅助编程之上的AI结对编程（L3）。
字节Marscode团队宣布于2025年4月1日停止维护，显示对Trae的重视。

OpenAI发布GPT-4.5研究预览版

GPT-4.5号称目前最好的对话大模型，提升识别模式、建立联系和创造性见解能力。
扩展无监督学习和推理，提高世界模型的准确性和直觉性。
使用可扩展技术方法，提升可操控性、对细微差别的理解能力和自然对话流畅度。
结合深度理解与改进的协作能力，更贴合人类协作节奏。

阿里推出QwQ-32b推理模型并开源

QwQ-32b以320亿参数规模，在数学推理、代码生成等任务中表现媲美甚至超越6710亿参数的DeepSeek-R1。
核心特点：参数效率高、创新功能集成、动态推理与智能体能力、高效训练机制。
技术路径验证了“强化学习+强大基座模型”在高效推理中的潜力。

Manus通用智能体发布引发AIAgent浪潮

中国Monica.im团队推出Manus，在GAIA测试中表现最先进（SOTA）。
Manus可控制电脑进行规划、自动挂载数据、调用工具执行任务。
引发AIAgent浪潮，多个智能体快速跟进，如OWL和OpenManus。

企业动态

AMD推出RadeonRX9000系新显卡9070XT和9070

基于RDNA4架构，采用台积电4nm工艺，配备16GBGDDR6显存。
核心参数：第二代AI加速器支持FP8数据类型和结构化稀疏性优化，第三代光线追踪加速器。
市场定价：RX9070国行起售价4499元，RX9070XT为4999元，主打高性价比。

科大讯飞星火X1模型升级

星火X1数学能力对标国际顶尖模型，参数量仅为70B，全面对标DeepSeekR1及OpenAIo1。
升级后在中小学作业批改、竞赛级难题解答等任务中表现显著提升。
星火医疗大模型X1效果超越GPT-4o和DeepSeekR1，在诊断推荐、健康咨询等场景中表现优异。

腾讯发布混元图生视频模型

混元发布图生视频模型“HunyuanVideo-I2V”，可根据图片生成5秒短视频并配背景音。
模型参数维持13B，项目已开源。

AI行业洞察

杭州投资智谱

智谱AI完成超10亿元人民币战略融资，投资方包括杭州城投产业基金和上城资本。
新资金将投向GLM大模型技术体系的迭代升级，计划2025年全面开源模型。

Lmarena.ai公布大模型排名

Grok3在总体评价中登顶，GPT-4.5与Grok3并列第一。
DeepSeek-R1在数学能力中并列第一名，在编程能力排名中并列第三名。

技术前沿

Karpathy表达对大模型评估基准失效的担忧

Karpathy认为当前存在评估危机，MMLU、SWE-BenchVerified、ChatbotArena等基准存在问题。
提出将私有评估集组合使用，并依赖“氛围检查”进行判断。

2B参数非SFT模型在视觉推理过程中重现DeepSeek“顿悟时刻”

VisualThinker-R1-Zero项目在2B参数未经监督微调的模型上，通过纯强化学习实现多模态推理的“顿悟时刻”。
在CVBench视觉基准测试中达到59.47%准确率，较基础模型提升30%。

Dynasor-CoT：通过确定性探索实现更高效的思维链

Dynasor-CoT方法通过思维扫描动态确定思维链终止点，有效节省计算资源。
实验发现该方法可以有效降低Token使用，解决大模型自我怀疑问题。

2025 年 3 月 10 日金工周报研究所分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com QwQ-32b 媲美 DeepSeek-R1-671b，Manus 引发智能体浪潮——AI 要闻周报 20250310 l阿里推出 QwQ-32b 推理模型并开源，效果媲美 DeepSeek-R1 3 月 6 日阿里推出高性能推理模型 QwQ-32b，以 320 亿参数规模在多项任务中展现出与更大规模模型（如 6710 亿参数的 DeepSeek-R1）相媲美甚至超越的性能，成为当前 AI 领域的焦点之一。近期研究报告《小市值强势，动量风格依旧——中邮因子周报 20250309》 - 2025.03.10 lManus 通用智能体发布引发 AI Agent 浪潮，多个智能体快速跟进 3 月 6 日凌晨，中国 Monica.im 团队推出通用人工智能 Manus，在 GAIA 测试三个难度测试中都达到了最先进（SOTA）表现。除此之外 Manus 在任务执行表现出了强大的功能，从演示实例中可以看到面对具体任务，Manus 可以控制电脑进行规划，自动挂载数据，调用工具执行任务。《高波不再持续，多数风格切换——中邮因子周报 20250302》–2025.03.03 《3 月胜率最高的策略：多微盘空1000——微盘股指数周报 20250302》– 2025.03.02 lOpenai 发布 GPT-4.5 研究预览版 OpenAI 于 2 月 28 日推出 GPT-4.5 AI 模型“研究预览版”，号称截至目前最好的对话大模型。GPT-4.5 提高了识别模式、建立联系和产生创造性见解的能力，知识库更广，更能理解用户意图，并且“情商”更高。《Deepseek 背景综述及在金融领域应用场景初探》 - 2025.02.26 l字节旗下 AI IDE Trae 发布国内版字节早前在海外发布的“中国首个 AI 原生集成开发环境（AIIDE）”Trae 于 3 月 3 日官宣上线国内版。海外版本内置 GPT-4o,Claude-3.5-Sonnet 模型。与海外版本不同，国内版本内置豆包 1.5Pro 大模型，同时支持使用满血版 DeepSeek R1、V3 模型。 l风险提示：本报告所有信息基于网络内容整理，不构成投资建议。《全面牛市正在到来，微盘有望修复前高——微盘股指数周报 20250209》- 2025.02.10 《基本面表现强势，风格切换加速——中邮因子周报 20250126》 -2025.01.27 《节前融资资金大幅净流出，ETF 资金聚焦机器人以及红利——行业轮动周报 20250126》 - 2025.01.26 《信号全部翻多，微盘股高胜率月份即将到来 —— 微盘股指数周报20250126》 - 2025.01.26 目录 1AI 重点要闻 ................................................................................ 41.1字节旗下 AI IDE Trae 发布国内版 ........................................................ 41.2Openai 发布 GPT-4.5 研究预览版 .......................................................... 61.3阿里推出 QwQ-32b 推理模型并开源，效果媲美 DeepSeek-R1 ................................... 71.4Manus 通用智能体发布引发 AI Agent 浪潮，多个智能体快速跟进 .............................. 92企业动态..................................................................................112.1AMD 推出 Radeon RX 9000 系新显卡 9070 XT 和 9070，聚焦推理和高性能计算...................112.2科大讯飞星火 X1 模型升级，对标世界一流模型.............................................122.3腾讯发布混元图生视频模型..............................................................133AI 行业洞察 ............................................................................... 143.1杭州投资智谱，杭州城投、上城资本参与投资..............................................143.2Lmarena.ai 公布大模型排名，Grok3 胜出，DeepSeek-R1 排名第六 ............................ 154技术前沿..................................................................................174.1Karpathy 表达对大模型评估基准失效的担忧 ............................................... 174.22B 参数非 SFT 模型在视觉推理过程中重现 DeepSeek“顿悟时刻”.............................184.3Dynasor-CoT：通过确定性探索实现更高效的思维链.........................................195风险提示..................................................................................20 图表目录图表 1： Trae ............................................................................ 4图表 2： MarsCode 将于 2025 年 4 月 1 日停止维护 .............................................5图表 3： GPT-4.5 评测对比.................................................................6图表 4： GPT-4.5 评测.....................................................................7图表 5： QwQ-32b 大模型评测 .............................................................. 8图表 6： Manus 测评.......................................................................9图表 7： OWL 架构........................................................................10图表 8： OpenManus Stars 趋势............................................................11图表 9： RX 9070 系列参数................................................................12图表 10：星火 X1 测评 ................................................................... 13图表 11：腾讯混元大模型-I2V ............................................................ 14图表 12： GLM 大模型.....................................................................15图表 13： lmarena.ai 大模型排名综合榜....................................................16图表 14： lmarena.ai 大模型排名汇总......................................................16图表 15： Karpathy 质疑大模型评价基准....................................................17图表 16： VisualThinker-R1-Zero 项目.....................................................18图表 17：顿悟时刻 ...................................................................... 18图表 18： DeepSeek 推理过长..............................................................19图表 19：有效降低 Token 使用 ............................................................ 20 1AI 重点要闻 1.1字节旗下 AI IDE Trae 发布国内版字节早前在海外发布的“中国首个 AI 原生集成开发环境（AI IDE）”Trae 于3 月 3 日官宣上线国内版。海外版本内置 GPT-4o, Claude-3.5-Sonnet 模型。与海外版本不同，国内版本内置豆包 1.5Pro 大模型，同时支持使用满血版DeepSeek R1、V3 模型。资料来源：Trae，中邮证券研究所 Trae 核心功能与亮点： ·AI 驱动的智能编程 Trae内置多种 AI 大模型，国内版搭载豆包 1.5 Pro 和满血版DeepSeek R1/V3 模型，支持自然语言生成代码、智能补全、代码理解与修复等功能。例如，用户输入“开发一个带用户登录功能的论坛”，Trae 可快速生成前后端框架代码，显著降低从零搭建项目的门槛。 ·多模态交互与 Builder 模式开发者可通过 Builder 模式用自然语言描述需求，由 AI 自动分解任务、生成项目框架并持续优化代码。此外，Trae 支持上传图片（如设计草图或错误截图），通过多模态技术精准解析需求，进一步简化协作流程。 ·全场景开发支持涵盖代码编辑、版本控制、调试等传统 IDE 功能，同时支持实时协作与云端开发。其“全局上下文分析”能力可理解整个项目的代码逻辑，提供精准的代码建议和错误定位，适用于 Web 开发、工具应用、游戏定制等场景。 ·低门槛与跨平台兼容 Trae 不仅服务于专业开发者，也面向非技术用户（如产品经理或爱好者），支持直接导入开源项目并快速运行调试。例如，用户可对英文界面的开源游戏 HexGL 进行中文

点击免费查看完整报告

AI要闻周报：QwQ-32b媲美DeepSeek-R1-671b，Manus引发智能体浪潮

AI重点要闻

字节旗下AIIDETrae发布国内版

OpenAI发布GPT-4.5研究预览版

阿里推出QwQ-32b推理模型并开源

Manus通用智能体发布引发AIAgent浪潮

企业动态

AMD推出RadeonRX9000系新显卡9070XT和9070

科大讯飞星火X1模型升级

腾讯发布混元图生视频模型

AI行业洞察

杭州投资智谱

Lmarena.ai公布大模型排名

技术前沿

Karpathy表达对大模型评估基准失效的担忧

2B参数非SFT模型在视觉推理过程中重现DeepSeek“顿悟时刻”

Dynasor-CoT：通过确定性探索实现更高效的思维链

你可能感兴趣

人工智能周报（25年第10周）：阿里巴巴发布并开源推理模型QwQ-32B，国产AI Agent产品Manus发布

传媒互联网行业周报：阿里发布QwQ-32B，Monica推出Manus

传媒行业周报：通用Agent应用Manus发布，阿里发布通义千问QwQ-32B

电子行业周报：通用型AIAgent“Manus”横空出世，阿里推出QwQ-32B全新推理模型

Manus AI智能体：AGI发展新范式的实践与测评

Manus智能体：开启AI新范式的先锋探索

Meta收购智能体创业公司Manus关注AI应用出海机会事件

AI动态汇总20250519：谷歌发布智能体白皮书，Manus全面开放注册

大语言模型在投研中的应用：DeepSeek、QwQ-32B与Manus技术解析、投研场景与量化应用

AI周观察：博通业绩反映ASIC高景气度，Manus引发Agent热潮