您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰海通证券]:美的打造全球首个智能体工厂,首个高刷视频理解开源端侧模型MiniCPM-V4.5问世 - 发现报告

美的打造全球首个智能体工厂,首个高刷视频理解开源端侧模型MiniCPM-V4.5问世

AI智能总结
查看更多
美的打造全球首个智能体工厂,首个高刷视频理解开源端侧模型MiniCPM-V4.5问世

摘要:产业最新趋势跟踪,点评产业最新风向 刘峰(研究助理)0755-23976068liufeng6@gtht.com登记编号S0880124060013 【具身智能产业动态】黑芝麻智能与云深处达成战略合作,共推具身智能平台全球市场应用2025.09.01【新材料产业周报】旭化成宣布扩产PSPI产能,中科科乐等多家新材料企业完成融资2025.08.31【数字经济资本市场周概览】巴兰仕北交所挂牌上市,飞骧科技向港交所递交招股书2025.08.31【数字经济周报】NVIDIA宣布Jetson AGX Thor开发者套件和量产级模组现已发售2025.08.31高位再迎调整,越南逆势上涨——东南亚指数双周报第6期2025.08.30 目录 1. AI行业动态..........................................................................................................32. AI应用资讯..........................................................................................................33. AI大模型资讯......................................................................................................34.科技前沿..............................................................................................................45.风险提示..............................................................................................................4 1.AI行业动态 美的荆州工厂打造全球首个智能体工厂 据中国新闻周刊公众号8月28日消息,美的洗衣机荆州工厂被世界纪录认证机构正式认定为“全球首个多场景覆盖的智能体工厂”。工厂通过“工厂大脑”统筹14个智能体,覆盖38个核心生产业务场景,实现秒级响应传统人工小时级任务,平均提效超过80%。其中,人形机器人“美罗”完成上下料及质检任务,AI巡检机器人“玉兔”提升面板检测效率,AMR自主移动机器人与协作机器人实现柔性化生产。智能体工厂以自主感知、决策、执行和学习为核心,将工厂数字化升级为具身智能生态。 2.AI应用资讯 腾讯开源Youtu-agent 据ALMCP公众号8月29日消息,腾讯优图实验室开源智能体构建框架Youtu-agent,通过YAML配置即可完成智能体开发,极大降低了使用门槛。其核心亮点是内置“元智能体”,可自动理解用户需求并生成配置文件,再根据执行结果动态优化。测试显示,基于开源模型DeepSeek-V3,Youtu-agent在WebWalkerQA和GAIA基准上准确率分别达到71.47%和72.8%,实现零依赖闭源模型的高性能表现。框架采用异步架构,支持并发任务与高效资源利用,在数据分析、文献综述、文件管理等场景均展现出强大适用性。 PixVerseV5全球上线 据爱诗科技AIsphere公众号8月27日消息,AI视频创作平台拍我AI(PixVerse)正式发布PixVerse V5,并宣布全球用户规模突破1亿。新版本重点优化了动态效果、细节一致性和指令遵循,大幅提升复杂运动、动漫同人、广告制作与艺术创作中的视频表现。用户案例显示,无论是体育生尝试AI自媒体,广告导演竞标,还是中学生借助AI制作课件,V5都展现了创作门槛大幅降低的优势。根据独立测评平台Artificial Analysis结果,PixVerse V5在图生视频全球排名Top2,文生视频排名Top3,稳居第一梯队。 阿里瓴羊升级智能小QAIAgent 据InfoQ公众号8月28日消息,阿里全资子公司瓴羊重磅升级“智能小Q”,从单一ChatBI能力跨越为多技能一体的超级数据分析Agent,意在解决数据分析长期存在的“专业化”和“人人可用”之间的矛盾。智能小Q通过自然语言转SQL/Python与BI特定语言的混合技术路径,推动数据分析完成从可视化、可决策到可行动的“三阶跃迁”。此次升级重点增强了问数、解读、报告三大能力,分别对应企业中一线人员难以自主取数、管理层被报表淹没、高层数据缺乏一致性三类典型困境。依托阿里生态的行业Know-How与十余年的OLAP引擎技术,小Q可实现分钟级取数与自动报告生成,显著提升企业运营效率。瑞幸、牧原、微医等百余家企业已率先应用,业务分析周期从数天压缩至分钟级,决策争议减少,管理效率提升显著。9月9日,该产品将全面开放使用。 3.AI大模型资讯 腾讯混元开源视频音效生成模型HunyuanVideo-Foley 据量子位公众号8月29日消息,腾讯混元团队正式开源端到端视频音效生成模型HunyuanVideo-Foley,能实现“看懂画面、读懂文字、配准声音”,为视频提供电影级音效。该模型解决了视频转音频生成中的三大难题:多模态数据不足、语义响应失衡和音质粗糙。HunyuanVideo-Foley基于创新的MMDiT架构和REPA损失函数,结合10万小时级TV2A数据集训练,具备强大泛化能力,能够在人物互 动、自然场景、动画等多样视频中生成音画高度契合的声音。在权威基准MovieGen-Audio-Bench上,其音频保真度、语义对齐和时序一致性均达SOTA水平,主观评分接近专业水准。 首个高刷视频理解开源端侧模型MiniCPM-V 4.5问世 据新智元公众号8月26日消息,面壁智能正式开源MiniCPM-V 4.5,这是全球首个具备「高刷视频理解」能力的端侧多模态模型。凭借仅8B参数,它在单图、长视频、OCR和复杂文档解析等任务上全面刷新同级SOTA,甚至超越Gemini 2.5Pro和GPT-4o等云端大模型。其核心创新在于3D-Resampler结构,实现高达96倍的视觉压缩率,在推理开销不变的情况下可处理6倍视频帧,真正做到「鹰眼级」视频捕捉。实测中,无论是高速翻页识字、驾驶场景识别,还是化学题解答、梗图理解,MiniCPM-V 4.5均表现精准高效。该模型同时支持常规与深度思考两种推理模式,兼顾快速响应与复杂分析。 腾讯发布游戏创作AI全链路解决方案VISVISE 据量子位公众号8月31日消息,在近期Devcom开发者大会上,腾讯游戏发布了面向全球的游戏创作AI全链路解决方案VISVISE。该系统涵盖动画制作、模型制作、数字资产管理和智能NPC四大管线,旨在解决传统游戏美术中重复、耗时的工作,如3D蒙皮和动画补帧。GoSkinning蒙皮工具可在30秒内完成2万顶点模型的权重分配,效率提升8倍;MotionBlink动画工具仅需少量关键帧即可生成完整序列动画,部分效果接近专业动捕水平。VISVISE基于腾讯长期积累的高质量数据和游戏研发经验,支持嵌入现有开发软件,无需重构管线。 群核科技发布空间大模型SpatialGen和SpatialLM 1.5 据量子位公众号8月27日消息,杭州群核科技推出专注室内场景的空间大模型,解决了长期困扰行业的“三维空间一致性”问题。该模型包括SpatialGen和SpatialLM 1.5,分别实现三维场景生成与空间语言驱动的布局编辑,支持自然语言指令下的精准空间任务处理。群核通过工具、数据、模型三位一体策略,利用全球最大室内空间数据集InteriorNet和高精度3D语义数据集InteriorGS,形成闭环生态,提升生成精度与交互能力。 4.科技前沿 中国团队实现世界首例基因编辑猪肺移植人体 据新华社公众号8月26日消息,中国广州医科大学附属第一医院团队成功将经过6处基因编辑的巴马香猪左肺移植到脑死亡人体内,模拟单肺移植手术。移植肺在术后9天内维持通气与气体交换功能,未发生超急性排异反应或感染,为异种肺移植提供关键数据。研究严格遵循伦理规范,受试者家属自愿参与。 5.风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等。受AI产业链新建产能变化影响,及全球AI软件销售不及预期,或因上下游芯片产出及量产能力限制,影响产业产品研发情况。 本公司具有中国证监会核准的证券投资咨询业务资格 分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。 免责声明 本报告仅供国泰海通证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。 本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。 市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。 本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰海通证券研究”,且不得对本报告进行任何有悖原意的引用、删节和修改。 若本公司以外的其他机构(以下简称“该机构”)发送本报告,则由该机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息或进而交易本报告中提及的证券。本报告不构成本公司向该机构之客户提供的投资建议,本公司、本公司员工或者关联机构亦不为该机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任。 国泰海通证券研究所 地址上海市黄浦区中山南路888号 电话(021)38676666