您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国泰海通证券]:腾讯开源混元世界模型 1.1,快手推出三位一体产品矩阵 - 发现报告

腾讯开源混元世界模型 1.1,快手推出三位一体产品矩阵

AI智能总结
查看更多
腾讯开源混元世界模型 1.1,快手推出三位一体产品矩阵

摘要:产业最新趋势跟踪,点评产业最新风向 刘峰(研究助理)0755-23976068liufeng6@gtht.com登记编号S0880124060013 【新材料产业周报】我国光刻胶领域取得新突破,科润新材料等多家新材料企业完成融资2025.10.27【数字经济资本市场周概览】超颖电子上交所主板挂牌上市,和辉光电向港交所递交招股书2025.10.27“四中全会”公报新增航天强国,行业有望加速发展——商业航天跟踪19期2025.10.27【数字经济周报】TI低功耗Bluetooth? 6.0无线MCU通过Bluetooth SIG认证2025.10.26区域普遍增长,越南大幅回调——东南亚指数双周报第10期2025.10.25 目录 1. AI行业动态..........................................................................................................32. AI应用资讯..........................................................................................................33. AI大模型资讯......................................................................................................34.科技前沿..............................................................................................................45.风险提示..............................................................................................................4 1.AI行业动态 LiblibAI获1.3亿美元B轮融资 据暗涌Waves公众号10月22日消息,LiblibAI已完成1.3亿美元B轮融资,由红杉中国、CMC资本及一家大型互联网公司联合领投,创下2025年以来中国AI应用领域最大单笔融资纪录。LiblibAI近期发布2.0版本,从模型社区升级为一站式AI创作Studio,业务扩张迅速。尽管公司尚未完全盈利,但在AI应用竞争加剧、算力与流量成本高企的背景下,“资本速度”成为核心壁垒。LiblibAI早期曾因备案受限濒临倒闭,如今通过多轮融资成功突围。业内认为,本轮融资将加速其在AI内容创作与Agent生态的布局,巩固其在国内AI创业浪潮中的领先地位。 腾讯ICCV现场直聘 据量子位公众号10月23日消息,ICCV 2025上,腾讯展台不仅展示最新AI技术,还直接进行现场招聘,形成“秀技术+直聊机会”的双重模式。腾讯混元、优图、ARC Lab等业务展示了多模态生成、3D重构、数字人及视频生成等前沿成果,同时核心业务大佬坐镇展台,与学生和研究者深入交流技术路线、岗位需求和实习机会。 阿里云SOSP亮相Aegaeon系统 据量子位公众号10月22日消息,阿里云在SOSP会议上展示了与北大合作研发的GPU池化系统Aegaeon,通过token级别自动扩缩容技术,将GPU需求从1192块降至213块。Aegaeon针对冷门模型占用长尾资源的问题,将GPU资源按token动态调度,使单个GPU可同时服务多达7个模型,同时通过组件复用、显式内存管理和细粒度KV缓存同步,将模型切换开销降低97%。实测中,吞吐量提升1.5至9倍,GPU利用率从13.3%-33.9%提升至48.1%,无SLO违规或服务中断,并已在阿里云百炼平台进行超过三个月的生产环境验证,显著优化大模型计算资源使用效率。 2.AI应用资讯 百度推出健康AI管家 据量子位公众号10月消息,百度健康推出7×24小时AI健康管家,实现“能聊、有料、会管”的全链路服务。该AI通过“AI+真人”双认证模式,为用户提供科普问答、初步问诊、医生推荐、挂号购药及健康档案管理等一体化服务。其多模态大模型结合36万医生实时标注和深度校验,支持医疗影像、检验报告及127类皮肤问题精准识别,诊断准确率高达98%。同时,AI管家能动态追踪健康指标变化,实现个性化咨询与零样本泛化。借助Online-RL在线强化学习与多层数据闭环,系统不断进化优化,为用户提供高效、安全、专业的智能健康体验。 3.AI大模型资讯 腾讯开源混元世界模型1.1 据AIGC开放社区公众号10月24日消息,腾讯混元团队正式开源混元世界模型1.1(WorldMirror),实现从任意视觉输入到3D可漫游世界的秒级生成。相较7月发布的1.0版本,新模型支持多视图及视频输入,具备多模态先验注入与多任务统一输出能力,可在单卡上实现端到端3D重建。其核心创新“多模态先验提示”机制能融合相机位姿、深度图等空间信息,大幅提升重建精度与一致性。混元世界模型1.1在点云重建、相机位姿估计、法线预测和新视角合成等任务上均达SOTA,重建速度和画质显著超越VGGT、AnySplat等国际领先模型。 Dexbotic开源 据新智元公众号10月22日消息,原力灵机正式开源具身智能VLA一站式科研平台Dexbotic,该平台在UR5e真机测试中实现叠盘子任务100%成功率,并在五大仿真环境中平均性能提升高达46%。Dexbotic基于PyTorch构建,整合视觉—语言—动作(VLA)模型,统一了数据、模型与实验层结构,支持从云端到RTX4090本地训练。平台创新引入自研DexboticVLM模型、统一Dexdata格式及实验脚本机制,显著提升研发复现与性能基线。此外,原力灵机还发布开源硬件DOS-W1,并联合Hugging Face发起真机基准RoboChallenge,旨在打通VLA从仿真到现实的全链路,加速具身智能落地。 快手推出“三位一体”产品矩阵 据量子位公众号10月23日消息,快手正式发布AI编程产品矩阵,进军AI Coding赛道。该矩阵由自研大模型KAT-Coder系列、智能开发工具CodeFlicker和企业级MaaS平台万擎组成,构成“模型+工具+平台”的三位一体体系,同时宣称其KAT-Coder-Air轻量版模型将对所有用户“免费使用”。CodeFlicker支持工程全流程开发,兼容主流IDE,DeepWiki可自动生成代码仓库说明书,提升开发效率。KAT-Coder覆盖多语言、多场景开发,性能优异且性价比高。万擎平台提供高可用、安全的模型调用与私有化部署能力。 百度飞桨开源PaddleOCR-VL 据s数字生命卡兹克公众号10月23日消息,百度最新开源的PaddleOCR-VL在OCR领域表现亮眼。该模型仅0.9B参数,却在OmniDocBench v1.5评测中实现SOTA,超越传统多阶段流水线和通用多模态大模型。其核心优势在于“双步架构”:先由PP-DocLayoutV2快速进行布局分析,将文档划分为标题、正文、表格、公式等 区 域 ; 再 由PaddleOCR-VL对 裁 切 后 的 子 图 进 行 精 准 识 别 , 实 现 高 效Markdown/LaTeX转换。实测中,无论是扫描PDF、手写笔记、多栏论文,还是票据和大型表格,PaddleOCR-VL都能保持高准确率,性能优于DeepSeek-OCR。 DeepSeek-OCR开源 据量子位公众号10月21日消息,DeepSeek团队推出3B参数规模的DeepSeek-OCR模型,采用“上下文光学压缩”策略,将文字信息压缩为视觉token,由模型“看图”理解内容,大幅降低计算开销。核心架构包括DeepEncoder编码器和DeepSeek3B-MoE-A570M解码器:编码器通过局部处理、卷积压缩和全局理解生成 高 信 息 密 度 视 觉token, 解 码 器 重 建 文 本 。 实 测 中 ,DeepSeek-OCR在OmniDocBench上达到SOTA水平,仅用极少视觉token即可实现高精度OCR解析,同时支持动态压缩和长上下文处理。 4.科技前沿 上海AI Lab提出AI自我进化框架MUSE 据量子位公众号10月22日消息,上海人工智能实验室等机构提出MUSE(Memory-Utilizing and Self-Evolving)框架,为LLM智能体打造“经验驱动、自我演化”的闭环系统,解决长程任务中“失忆、静态参数、无法持续学习”的痛点。核心包括分层记忆模块、子任务反思机制及自我演化闭环,让智能体像人类一样“先做、再反思、后进化”。实验证明,MUSE在TAC长期生产力任务基准上取得51.78%成绩,取得了显著的SOTA性能。 5.风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等。受AI产业链新建产能变化影响,及全球AI软件销售不及预期,或因上下游芯片产出及量产能力限制,影响产业产品研发情况。 本公司具有中国证监会核准的证券投资咨询业务资格 分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。 免责声明 本报告仅供国泰海通证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。 本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。 市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。 本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰海通证券研究”,且不得对本报告进行任何有悖原意的引用、删节和修改。 若本公司以外的其他机构(以下简称“该机构”)发送本报告,则由该机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息或进而交易本报告中提及的证券。本报