AI智能总结
摘要:产业最新趋势跟踪,点评产业最新风向 AI应用资讯 腾讯元器接入微信支付MCP字节跳动开源EX-4D星流Agent上线百度发布MuseSteamerAI智能硬件品牌爱小伴推出全球首款AI儿童语伴机字节跳动推出图像生成新模型XVerse阿里通义开源首个CoT音频模型ThinkSound豆包上线“深入研究”功能 AI大模型资讯 昆仑万维开源Skywork-Reward-V2百度文心4.5系列模型开源华为宣布开源盘古7B稠密和72B混合专家模型 AI科技前沿越疆发布全球行业最快大负载协作机器人CR 30H 风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等 目录 1. AI行业动态..........................................................................................................32. AI应用资讯..........................................................................................................33. AI大模型资讯......................................................................................................44.科技前沿..............................................................................................................45.风险提示..............................................................................................................5 1.AI行业动态 智谱获上海国资10亿投资 据钛媒体ap月2日消息,7月2日,智谱在开放平台产业生态大会上,宣布获得浦东创投集团和张江集团10亿元战略投资,并将与上海仪电、浦发集团共建AI新型基础设施。作为首家启动IPO的“大模型六小虎”企业,智谱2025年已密集获得多地国资投资。同时,智谱还发布了新一代通用视觉语言模型GLM-4.1V-Thinking,以及上线Agent聚合平台“应用空间”。其海外布局也备受关注,OpenAI认为智谱在与美国竞争,抢占新兴市场份额。 2.AI应用资讯 腾讯元器接入微信支付MCP 据腾讯云智能7月4日消息,腾讯元器于2025年7月3日正式接入微信支付MCP,为智能体开发者提供下单、赞赏、订单查询等核心支付功能,标志着智能体商业化进入新阶段。该功能通过低门槛的提示词调用或工作流编排实现,开发者无需复杂技术背景即可快速集成支付能力如微信支付MCP支持生成支付二维码、JSAPI预下单接口及订单状态查询,且开发者可自主设置赞赏金额、触发逻辑等。 字节跳动开源EX-4D,推动视频生成技术革新 据算力豹公众号7月3日消息,字节跳动PICO-MR团队开源EX-4D视频生成框架。它能基于单目视频,生成高质量多视角的4D视频序列。其核心技术DW-Mesh,可构建全密闭网格,精准处理遮挡等信息,结合两种模拟mask生成策略,降低数据采集成本。性能上,在多项指标上超越现有开源方案,极端视角下优势更明显。 星流Agent上线 据LiblibAI公众号7月3日消息,星流Agent延续Lovart全栈设计能力,适配中文语义、东方美学与本地场景,能理解需求、自动匹配风格、选模型、出整套物料,如输入需求可生成系列设计。具备全流程自动生成能力,像输入咖啡产品视觉方案需求,能产出主图、社媒封面等。支持无边画布智能编辑,可边聊边改图。接入十多个顶尖大模型,覆盖图像、视频等多模态创作,输出格式丰富。对中文理解精准,能准确生成符合“中秋节宣传图”“京剧摄影图片”等需求的内容。 百度发布MuseSteamer 据百度公众号7月2日消息,百度自研视频生成模型“MuseSteamer”,仅靠18张图片就能生成含大量音效、人物台词的视频,达百万级专业制作效果。其指令遵循力强,人物逼真、运镜佳,支持电影级艺术表达,能一体化生成带音效和台词的视频。Turbo版已上线绘想平台,限时免费公测。 AI智能硬件品牌爱小伴推出全球首款AI儿童语伴机 据亿家亿伴智能科技公众号7月2日消息,爱小伴推出全球首款AI儿童语伴机,专为3-7岁儿童设计,聚焦语言敏感期,助力“不敢说、不会说、不爱说”的孩子提升语言能力。其突破传统早教机局限,以深度AI对话和情感化设计激发表达欲,获多家权威媒体报道,旨在用科技实现高质量陪伴。 字节跳动推出图像生成新模型XVerse 据量子位公众号7月2日消息,字节跳动发布多主体控制生成模型Xverse,可精准控制多个设定主体,且不破坏图像质量,能应对多主体、多光源、多风格等场景。其核心是学习DiT文本流调制机制中的偏移量,含四大关键部分:T-Mod适配器融合图像与文本特征生成偏移量;文本流调制机制将参考图像转为偏移量注入模型;VAE编码模块增强细节保留;两种正则化技术提升质量与一致性。字节 推出XVerseBench基准测试评估其能力,结果显示Xverse在多主体生成一致性上显著优于其他技术。该模型依托团队此前在AIGC一致性方向的多项成果研发而成,未来将持续提升AI创作的智能化与趣味性。 阿里通义开源首个CoT音频模型ThinkSound 据量子位公众号7月1日消息,阿里通义语音团队的ThinkSound,通过引入链式思维推理,模仿人类音效师的工作流程,先分析视觉动态,再推断声学属性,最后合成音效,能精准建立声音和画面的对应关系,增强音频的真实感与同步性,更好地满足影视制作、游戏开发等场景对高质量音频的需求。 豆包上线“深入研究”功能 据中国网科技公众号6月30日消息,字节跳动的AI助手豆包上线“深入研究”功能。借助模型的搜索、推理及Agent能力,能够迅速应对长途旅行攻略制定、政策内容解读、商业趋势剖析等复杂任务,在短短几分钟内就能生成结构化的报告。生成的研究成果不仅可以通过可视化网页、文档等形式展示,还能一键转换为播客,方便用户随时收听。目前,该功能已在豆包的App、网页版和电脑端启动测试,适合学生、职场人等需要高效整合大量信息的人群使用。 3.AI大模型资讯 昆仑万维开源Skywork-Reward-V2 据昆仑万维集团公众号7月4日消息,昆仑万维开源第二代奖励模型Skywork-Reward-V2系列,含参数6亿-80亿的8个模型,在RewardBenchv1/v2等7大评测中全获最佳。其基于4000万对偏好的Skywork-SynPref-40M数据集,经人机协同两阶段流程筛选出2600万条优质数据。最小的0.6B模型性能接近上一代27B模型,1.7B模型超70B级开源SOTA,8B模型成最优开源奖励模型。该系列在知识密集型任务等多维度领先,HuggingFace累计下载超75万次,推动RLHF研究发展。 百度文心4.5系列模型开源 据百度AI公众号6月30日消息,百度文心4.5系列模型今日正式开源,共10款,含47B、3B混合专家(MoE)模型(最大总参424B)及0.3B稠密参数模型。模型开源至HuggingFace等平台,采用创新多模态异构MoE架构,基于飞桨框架训练,FLOPs利用率47%,在多模态基准测试中达SOTA,尤其在指令遵循等任务表现佳,按Apache2.0协议开源。配套ERNIEKit开发套件和FastDeploy部署套件,降低开发部署门槛。后续将推出系列课程、活动及服务站,助力开发者应用与创新。 华为宣布开源盘古7B稠密和72B混合专家模型 据热点科技6月30日消息,华为官宣开源盘古7B、72B两款大模型及为昇腾NPU芯片优化的推理代码,已在GitCode上线。盘古7B(盘古Embedded)有70亿参数,是双系统框架,具备“快思慢想”功能,可依任务复杂度选模式,平衡延迟与推理深度,在复杂推理测试中性能强于Qwen3-8B、GLM4-9B。盘古72B(盘古ProMoE)为720亿参数的MoE混合专家模型,华为提出新型MoGE分组混合专家模型,能实现负载均衡。其针对昇腾300IDuo、800IA2平台优化,在昇腾800IA2上推理速度达单卡1148token/s。 4.科技前沿 越疆发布全球行业最快大负载协作机器人CR 30H 据中国机器人网公众号6月30日消息,越疆推出大负载协作机器人CR 30H,实现负载与速度双突破,30kg负载下关节速度达300°/s,为同级别之最,有标准版、触控版和洁净版可选。其搭载HyperMove算法提升效率20%,振动抑制等算法确 保运行稳定,96V伺服驱动增强动力,IP67防护适应复杂环境。具备轻量化设计,工作半径1800mm,重复定位精度±0.05mm,支持拖拽示教和图形化编程,部署灵活。依托90%自研零部件,全球部署超8万台。 5.风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等。受AI产业链新建产能变化影响,及全球AI软件销售不及预期,或因上下游芯片产出及量产能力限制,影响产业产品研发情况。 本公司具有中国证监会核准的证券投资咨询业务资格 分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。 免责声明 本报告仅供国泰海通证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。 本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。 市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。 本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰海通证券研究”,