您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中邮证券]:AI要闻周报:QwQ-32b媲美DeepSeek-R1-671b,Manus引发智能体浪潮 - 发现报告

AI要闻周报:QwQ-32b媲美DeepSeek-R1-671b,Manus引发智能体浪潮

2025-03-10肖承志、冯昱文中邮证券S***
AI智能总结
查看更多
AI要闻周报:QwQ-32b媲美DeepSeek-R1-671b,Manus引发智能体浪潮

2025 年 3 月 10 日 金工周报 研究所 分析师:肖承志SAC 登记编号:S1340524090001Email:xiaochengzhi@cnpsec.com研究助理:冯昱文 SAC 登记编号:S1340124100011Email:fengyuwen@cnpsec.com QwQ-32b 媲美 DeepSeek-R1-671b,Manus 引发智能体浪潮——AI 要闻周报 20250310 l阿里推出 QwQ-32b 推理模型并开源,效果媲美 DeepSeek-R1 3 月 6 日阿里推出高性能推理模型 QwQ-32b,以 320 亿参数规模在多项任务中展现出与更大规模模型(如 6710 亿参数的 DeepSeek-R1)相媲美甚至超越的性能,成为当前 AI 领域的焦点之一。 近期研究报告 《小市值强势,动量风格依旧——中邮因子周报 20250309》 - 2025.03.10 lManus 通用智能体发布引发 AI Agent 浪潮,多个智能体快速跟进 3 月 6 日凌晨,中国 Monica.im 团队推出通用人工智能 Manus,在 GAIA 测试三个难度测试中都达到了最先进(SOTA)表现。除此之外 Manus 在任务执行表现出了强大的功能,从演示实例中可以看到面对具体任务,Manus 可以控制电脑进行规划,自动挂载数据,调用工具执行任务。 《高波不再持续,多数风格切换——中邮因子周报 20250302》–2025.03.03 《3 月胜率最高的策略:多微盘空1000——微盘股指数周报 20250302》– 2025.03.02 lOpenai 发布 GPT-4.5 研究预览版 OpenAI 于 2 月 28 日推出 GPT-4.5 AI 模型“研究预览版”,号称截至目前最好的对话大模型。GPT-4.5 提高了识别模式、建立联系和产生创造性见解的能力,知识库更广,更能理解用户意图,并且“情商”更高。 《Deepseek 背景综述及在金融领域应用场景初探》 - 2025.02.26 l字节旗下 AI IDE Trae 发布国内版 字节早前在海外发布的“中国首个 AI 原生集成开发环境(AIIDE)”Trae 于 3 月 3 日官宣上线国内版。海外版本内置 GPT-4o,Claude-3.5-Sonnet 模型。与海外版本不同,国内版本内置豆包 1.5Pro 大模型,同时支持使用满血版 DeepSeek R1、V3 模型。 l风险提示: 本报告所有信息基于网络内容整理,不构成投资建议。 《全面牛市正在到来,微盘有望修复前高——微盘股指数周报 20250209》- 2025.02.10 《基本面表现强势,风格切换加速——中邮因子周报 20250126》 -2025.01.27 《节前融资资金大幅净流出,ETF 资金聚焦机器人以及红利——行业轮动周报 20250126》 - 2025.01.26 《信号全部翻多,微盘股高胜率月份即将到来 —— 微盘股指数周报20250126》 - 2025.01.26 目录 1AI 重点要闻 ................................................................................ 41.1字节旗下 AI IDE Trae 发布国内版 ........................................................ 41.2Openai 发布 GPT-4.5 研究预览版 .......................................................... 61.3阿里推出 QwQ-32b 推理模型并开源,效果媲美 DeepSeek-R1 ................................... 71.4Manus 通用智能体发布引发 AI Agent 浪潮,多个智能体快速跟进 .............................. 92企业动态..................................................................................112.1AMD 推出 Radeon RX 9000 系新显卡 9070 XT 和 9070,聚焦推理和高性能计算...................112.2科大讯飞星火 X1 模型升级,对标世界一流模型.............................................122.3腾讯发布混元图生视频模型..............................................................133AI 行业洞察 ............................................................................... 143.1杭州投资智谱,杭州城投、上城资本参与投资..............................................143.2Lmarena.ai 公布大模型排名,Grok3 胜出,DeepSeek-R1 排名第六 ............................ 154技术前沿..................................................................................174.1Karpathy 表达对大模型评估基准失效的担忧 ............................................... 174.22B 参数非 SFT 模型在视觉推理过程中重现 DeepSeek“顿悟时刻”.............................184.3Dynasor-CoT:通过确定性探索实现更高效的思维链.........................................195风险提示..................................................................................20 图表目录 图表 1: Trae ............................................................................ 4图表 2: MarsCode 将于 2025 年 4 月 1 日停止维护 .............................................5图表 3: GPT-4.5 评测对比.................................................................6图表 4: GPT-4.5 评测.....................................................................7图表 5: QwQ-32b 大模型评测 .............................................................. 8图表 6: Manus 测评.......................................................................9图表 7: OWL 架构........................................................................10图表 8: OpenManus Stars 趋势............................................................11图表 9: RX 9070 系列参数................................................................12图表 10: 星火 X1 测评 ................................................................... 13图表 11: 腾讯混元大模型-I2V ............................................................ 14图表 12: GLM 大模型.....................................................................15图表 13: lmarena.ai 大模型排名综合榜....................................................16图表 14: lmarena.ai 大模型排名汇总......................................................16图表 15: Karpathy 质疑大模型评价基准....................................................17图表 16: VisualThinker-R1-Zero 项目.....................................................18图表 17: 顿悟时刻 ...................................................................... 18图表 18: DeepSeek 推理过长..............................................................19图表 19: 有效降低 Token 使用 ............................................................ 20 1AI 重点要闻 1.1字节旗下 AI IDE Trae 发布国内版 字节早前在海外发布的“中国首个 AI 原生集成开发环境(AI IDE)”Trae 于3 月 3 日官宣上线国内版。海外版本内置 GPT-4o, Claude-3.5-Sonnet 模型。与海外版本不同,国内版本内置豆包 1.5Pro 大模型,同时支持使用满血版DeepSeek R1、V3 模型。 资料来源:Trae,中邮证券研究所 Trae 核心功能与亮点: ·AI 驱动的智能编程 Trae内置多种 AI 大模型,国内版搭载豆包 1.5 Pro 和满血版DeepSeek R1/V3 模型,支持自然语言生成代码、智能补全、代码理解与修复等功能。例如,用户输入“开发一个带用户登录功能的论坛”,Trae 可快速生成前后端框架代码,显著降低从零搭建项目的门槛。 ·多模态交互与 Builder 模式 开发者可通过 Builder 模式用自然语言描述需求,由 AI 自动分解 任务、生成项目框架并持续优化代码。此外,Trae 支持上传图片(如设计草图或错误截图),通过多模态技术精准解析需求,进一步简化协作流程。 ·全场景开发支持 涵盖代码编辑、版本控制、调试等传统 IDE 功能,同时支持实时协作与云端开发。其“全局上下文分析”能力可理解整个项目的代码逻辑,提供精准的代码建议和错误定位,适用于 Web 开发、工具应用、游戏定制等场景。 ·低门槛与跨平台兼容 Trae 不仅服务于专业开发者,也面向非技术用户(如产品经理或爱好者),支持直接导入开源项目并快速运行调试。例如,用户可对英文界面的开源游戏 HexGL 进行中文