您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:人工智能周报(25年第24周):OpenAI上线o3-pro模型,字节跳动发布豆包大模型1.6 - 发现报告

人工智能周报(25年第24周):OpenAI上线o3-pro模型,字节跳动发布豆包大模型1.6

文化传媒2025-06-19张伦可、陈淑媛、张昊晨、王颖婕国信证券Z***
AI智能总结
查看更多
人工智能周报(25年第24周):OpenAI上线o3-pro模型,字节跳动发布豆包大模型1.6

人工智能动态:1)产品应用:OpenAI上线o3-pro AI模型,兼具高效性能与精准输出能力;Meta推出世界模型V-JEPA 2,具备卓越环境理解与预测能力;苹果发布Xcode26开发者工具,内置ChatGPT赋能开发; 字节跳动发布豆包大模型1.6,采用统一定价模式;阿里开源3D数字人应用,革新直播与虚拟互动体验;腾讯混元3D 2.1全链路开源,几何生成与材质表现显著提升。2)底层技术:阿里通义实验室开源Mask Search预训练框架,提升AI复杂问题解决表现;DeepMind与布朗大学合作开发“力提示”技术,实现无3D模型逼真运动效果3)行业政策:工业和信息化部会议审议《2025年两化融合工作要点》,部署推进策略。 投资建议:互联网一季报披露完毕,业绩整体稳健。电商行业竞争依旧激烈,各平台选择继续向商家让利、或在外卖即时零售领域加大投入寻找新增量。AI方面,巨头的业务场景,如云计算、广告等持续受益,但短期AI Agent等方面仍需打磨。当前,我们认为恒生科技指数处于震荡期,推荐业绩稳健、估值较低的防守型标的腾讯音乐、网易。 风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。 AI相关网站流量数据 图1:AI相关网站周访问量(百万) 图2:第一梯队AI相关网站周访问量变动(百万) 图3:第二梯队AI相关网站周访问量变动(百万) 图4:第三梯队AI相关网站周访问量变动(百万) 图5:新增聊天、教育类AI相关网站周访问量变动(百万) 人工智能动态:OpenAI上线o3-pro模型,字节跳动发布豆包大模型1.6 (一)产品应用 OpenAI上线o3-proAI模型,兼具高效性能与精准输出能力。6月11日,OpenAI发布最新o3-proAI模型,作为o3推理模型升级版,其在AIME2024数学测试中超越谷歌Gemini2.5Pro,博士级GPQADiamond测试成绩也优于Anthropic Claude4Opus。o3-pro支持网络搜索、文件分析等多种工具调用。不过,该模型存在响应速度较慢、不支持图像生成及Canvas功能等不足。 Meta推出世界模型V-JEPA2,具备卓越环境理解与预测能力。6月11日,Meta推出基于视频训练的世界模型V-JEPA2,该模型基于联合嵌入预测架构构建,拥有12亿参数,在去年首个基于视频训练模型V-JEPA基础上,大幅提升动作预测和世界建模能力,实现了先进的环境理解与预测,可助力AI代理在新环境完成零样本规划与机器人控制任务。 苹果发布Xcode26开发者工具,内置ChatGPT赋能开发。6月10日,苹果发布Xcode26开发者工具,内置ChatGPT等大语言模型,革新iOS26、iPadOS26等系统应用开发体验。Xcode26支持开发者将大语言模型融入编码全流程,还支持其他API密钥与本地模型运行。此外,该工具重新设计导航体验,改进本地化目录,增强Voice Control支持,开发者可通过语音控制Swift代码编写和Xcode界面导航。 字节跳动发布豆包大模型1.6,采用统一定价模式。6月11日,火山引擎在北京举行的2025 FORCE原动力大会上发布了豆包大模型1.6,采用统一的定价策略。 这款多模态深度思考模型支持auto、thinking及non-thinking三种模式,能够处理文本、图像和视频等多种输入,并生成高质量的文本输出。凭借其强大的推理能力和256k长上下文窗口,豆包大模型1.6在多个权威测评中表现突出,尤其在推理和数学能力上进步显著。 阿里开源3D数字人应用,革新直播与虚拟互动体验。6月13日,阿里巴巴推出基于MNN框架的3D数字人技术——MNNTaoAvatar。该技术实现了单图秒级生成超写实3D数字人,并支持低延迟实时对话。MNNTaoAvatar融合了3D高斯重建、AI语音驱动等先进技术,为直播、虚拟社交和AR应用提供了全新的互动方式。 此外,阿里还开源了Mnn3dAvatar框架,进一步降低了3D数字人内容创作的门槛。 腾讯混元3D2.1全链路开源,几何生成与材质表现显著提升。6月14日,在CVPR 2025会议上腾讯宣布混元3D2.1大模型正式对外开源,成为首个全链路开源的工业级3D生成大模型。新模型优化了几何生成的质量,并首次开放了基于物理的渲染(PBR)材质生成技术,大幅提升了3D资产的质感和光影效果。此外,混元3D2.1适配消费级显卡,降低了开发门槛,支持游戏、电影及电商等多个领域快速创建高质量的3D角色、道具和产品模型。 (二)底层技术 阿里通义实验室开源MaskSearch预训练框架,提升AI复杂问题解决表现。6月10日,阿里通义实验室宣布开源MaskSearch预训练框架,通过检索增强掩码预测(RAMP)机制让AI具备主动搜索和多步推理能力,显著提升开放域问答及复杂推理任务的性能。DAPO算法结合格式奖励与回答奖励,优化生成答案的准确性和逻辑性,媲美更大规模的模型MaskSearch支持多种模型,并已在教育、医疗等多个领域展示出其价值。 DeepMind与布朗大学合作开发“力提示”技术,实现无3D模型逼真运动效果。6月4日,据报道,谷歌DeepMind团队携手布朗大学正在研发一种名为“力提示”的技术。这项技术能够在无需依赖3D模型或物理引擎的情况下,实现逼真运动模拟。用户仅需指定力的方向和强度,就能轻松控制AI生成视频中的物体运动,支持全局力和局部力的应用,为视频制作带来了前所未有的便捷性和创造性。 (三)行业政策 6月,工业和信息化部两化融合工作领导小组会议召开,审议《关于以工业智能体为核心深化人工智能工业应用的指导意见》。会议明确提出以工业智能体为抓手推动制造业全流程智能化升级。在此次发布的指导意见中,工信部强调了实施“人工智能+制造”行动的重要性,并提出要加快重点行业的智能升级,打造智能制造的“升级版”。该意见明确了以工业智能体为关键手段,旨在通过深化人工智能技术的应用来促进制造业的数字化转型。具体措施包括强化工业软件、智能传感器等核心技术的研发,建设高质量的数据集,以及开发低成本且高效的数字化工具。此外,还提出了要加强企业内部转型升级的动力,利用龙头企业的优势带动产业链上下游的协同发展,并支持中小企业进行数字化转型。为了实现这些目标,政策还倡导建立和完善数字服务体系,培育既懂行业又熟悉数字化的服务商,从而确保人工智能能够切实有效地融入到制造业的各个环节之中。 (四)重点事件预告 06月18日-20日:MWC上海2025 06月19日-20日:2025亚马逊云科技中国峰会 06月20日-22日:华为开发者大会HDC2025 投资建议 互联网一季报披露完毕,业绩整体稳健。电商行业竞争依旧激烈,各平台选择继续向商家让利、或在外卖即时零售领域加大投入寻找新增量。AI方面,巨头的业务场景,如云计算、广告等持续受益,但短期AIAgent等方面仍需打磨。当前,我们认为恒生科技指数处于震荡期,推荐业绩稳健、估值较低的防守型标的腾讯音乐、网易。 风险提示 政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。