您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[AIGC安全实验室]:2025年AIGC发展研究报告4.0版-清华大学-202510 - 发现报告

2025年AIGC发展研究报告4.0版-清华大学-202510

AI智能总结
查看更多
2025年AIGC发展研究报告4.0版-清华大学-202510

本报告部分内容由AIGC生成,如有错误,请微博或视频号私信,我们进行修订 @新媒沈阳团队 2025年10月 @新媒沈阳团队简介 沈阳为清华大学新闻学院/人工智能学院双聘教授、博导,清华大学新闻学院新媒体研究中心主任。先后担任计算机、信息管理、新闻传播、人工智能等多个学科教授。 领导学术研究团队近30人。指导大数据、AI、机器人等多个产业团队。 往事如风:2007年个人编写的软件ROST系列免费语义软件,各界学者使用该软件已撰写数千篇论文;2015年一年办了50场新媒体沙龙;2020年组织近千名志愿者网络救助2600多名疫情求助者;2025年团队PPT阅读量近亿;2025年开始研发AI癌症辅助诊疗平台,已内测上线;近十五年撰写内参和接受内参采访近百次。 读万卷书,行万里路,交万位友,历万般事。 邮箱:124739259@qq.com;微博:@新媒沈阳 六大研究方向 新媒体与网络舆论 团队历年研究报告 团队正在做的工作 发展现况 通往AGI之路:深思妙算,知行合一 未来五年,AGI的关键突破将集中在四个方向: lAI将获得更稳定的长期记忆与可调控的人格,解决遗忘与随机性的问题;l机器人、传感器与虚拟现实等物理接口将与AI深度融合,使智能体真正从虚拟空间走向现实世界;lAI将不再局限于总结已有知识,而是能够自主学习、提出并验证新的科学假说;l人类社会需要在法律、伦理、经济与教育等制度层面进行系统性重构,以确保AGI能够顺利嵌入并与社会形成新的平衡。 开闭源之争:开放聚智,闭源求精 •因应开源大模型挑战,Open AI发布GPT-OSS•DeepSeek联动下一代国产芯片 中国:开源世界第一 美国:闭源世界第一 开放 社区化 闭 源 模 型比 开 源 模 型 性 能领 先 约9个 月 在5 0个A I关 键 竞 争 领 域 中 ,美 国2 6个 领 先 , 中 国13个 领先 , 另 有1 1个 领 域 势 均 力 敌( 本 页 内 容 由A I自 动生 成 ) 。中 国 偏 向 于“应 用 落 地 与 产 业 集 成” “场 景 驱动—规模扩张—成本优化”的逻 辑 , 而 美 国 的 优 势 则 更 集 中 在“底 层 突 破 与 原 理 创 新”, 体 现 的 是“基 础 科 学—技 术 范 式—跨 学 科 颠 覆”的 逻 辑 , 中 国 走 的 是“快 迭代”, 美 国 走 的 是“慢 积 累”, 中 国 需 要 补 课 的 方 向 是 大 模 型 基 础 训 练 、A I芯 片 与 自 主 可 控 算 法 体 系 , 美 国 则 需 要 在 产 业 级 应 用 落 地 与 复 杂 社 会 场 景 治 理 方 面 加强。长远看,中美差异领域会逐渐收敛,最终的竞争核心在于谁能率先实现跨层级的整合,即既能掌握底层突破,又能实现全链路商业化。中国的潜在盲点在 于 对前 沿 科 学 与 基 础 突 破 的 持 续 性 投 入 不 足 , 容 易 形 成“应 用 繁 荣—底 层 受 制”的 格 局 ; 而 美 国 的 潜 在 盲 点 则 是 在 大 规 模 场 景 落 地 和 复 杂 社 会 治 理 上 的 经 验 不 足 , 容 易出现“技术强—社会弱”的失衡。中美AI的对比是两种发展模式的博弈:一方是“应用爆发驱动模式”,另一方是“科 学 范 式 驱 动 模 式”。 未 来A I竞 争 的 真 正 高地 是“跨 层 整 合 力”, 谁 能 打 通“底 层 范 式 突 破—中 层 系 统 工 程—上 层 社 会 应 用”的 闭 环 , 谁 就 掌 握 了 通 向AG I的 钥 匙 。AG I的 到 来 不 会 依 靠 某 一 个 单 点 突 破 , 而是全栈融合的结果,中美最终要面对的考验,是如何把各自的优势拼接成完整生态,而不是仅仅在局部领域领先。中国在速度,美国在深度;真正的胜负,在整合。 中国AI突围:换道超车开源破局 保持战略定力,以国产系统性替代+差异化技术路径+开源生态联盟+场景优势破局,将挑战转化为“换道超车”的历史机遇 技术路径 1.技术竞争加剧 •低成本高效率:•窗口期延长: •GPT-5强化•美国商业化领先•人才流动•数据主权•产业赋能 生态与场景 •开源生态基础:•应用场景纵深:超大规模市场+完整产业链, 1.国产化不只是替代:要从“仿制-替代”升级为“制度化-再定义”,通过标准、评测、算力体系的重建,把本土方案变成国际不可绕过的选项。 3.AI的社会嵌入实验场:中国的优势不仅在于用户规模,更在于社会制度的实验弹性。可以把“AI+行业”的试点看作一场制度级Beta测试,在试错中生成新秩序。 Agent化与生态嵌入 各公司不再一味追求超大参数,而是强调高效推理、低延迟、多模态集成。 从单一对话工具演化为Agent,逐步嵌入生产力工具、搜索、电商、社交、内容平台。 OpenAI、DeepMind推动推理优化与多模态融合;DeepSeek、阿里强调低成本可及性;字节则突出高并发场景适配。 Meta、字节、阿里借助既有应用生态加快整合;OpenAI、Anthropic等则通过插件/生态协议扩展边界。 最强AI:算力织图生态共鸣 AI的演化正在经历三重转向: Ø从通用幻想到垂直深耕,产业格局注定走向分工生态而非大一统全能神; Ø从规模红利到效率平衡,未来竞争比拼的不再是算力堆叠,而是算力配置与任务效率的结构性平衡;Ø从封闭独占到开放共鸣,不是开源取代闭源,而是双轨竞逐、互相借力。 在这一逻辑下,场景决定分层技术,垂直化比万能化更具生命力,算力也不再是单一堆砌,而是一门关于效率—平衡的调度学,而开源与闭源则共同成为创新的双引擎。情况截止:2025-09 性能测评:衡技析用,鉴短谋长 2024-2025顶级测评透露三大信号:大模型比拼已由堆规模转向拼精度,通用智能曲线陡升;以中国团队为首的开源阵营凭低成本与社区协作重塑全球格局。 冠军轮换=预训练尺度定律初显,算法占比凸显 传统理解多归因于模型迭代速度快或公司资源配置差异。但从系统层级看,这种“冠军不稳定”恰恰是一种集体协优化机制的表现。 这些模型的进步彼此参照、快速模仿(通过开源权重、论文结构、CoT技术等),形成“生态-智性互导”系统。模型的排名轮替不再是个人产品胜出,而是整合式生态不断自我刷新边界。 AI大模型生态表现出类似多中心智能系统的“分布式演化”特征,比过去任何一个中心化技术进步路径都更像“集体智慧”涌现。情况截止:2025-08 产品流量:一超多强增长趋稳 平台整合期 •超级AI在哪?垂直AI+集成/代理化AI=超级AI 数据来源:SimilarWeb,2025-08AI的终局,不是谁的模型最大,而是谁能调度效率、落地应用、整合平台,成为社会的超级接口。一超多强,效率制胜,平台合流 AGI演化:虚实交互跨界融合 规模扩张只是短期推力,架构创新是中期突破,而社会制度、能效约束和应用生态才是长期决定力量 认知架构更新:现有的Transformer虽能在语言模式拟合与生成上展现强大能力,但在长期记忆、抽象推理、因果建模、自我更新等方面存在天然短板。需要研发更高效的认知单元,构建动态记忆与世界模型,并实现跨模态、跨任务的统一推理,而非依赖插件式拼接。 能效与可持续性:Scaling Law显露边际递减,单纯扩大参数规模已无法支撑未来演进,反而带来算力瓶颈、能耗飙升、数据枯竭。发展低能耗高性能的计算范式,通过小样本学习、自监督、自我生成数据实现高效学习,需要探索类似“智能压缩算法”的模式 智能体自动化:折叠工作优化效率 多模态融合:融模贯意,化境通神 单模态孤立学习 多模态表示融合 深度融合与协同推理 模型通过共同的向量空间来表示不同模态的内容,从而实现跨模态对齐与检索。 最新的研究趋势是让AI实现跨模态的深层协同,不仅能理解各模态信息,还能在内部形成统一的世界模型来推理。 不同模态各自发展,缺乏交叉。 这一阶段虽然在各领域取得了突破,但模型只能在各自信息孤岛中工作。 多模态的发展三个层次:最初阶段是“单模态孤岛”;中期则进入“跨模态桥梁”,通过对齐与融合,让视觉、语言、声音、动作等模态开始互通有无,实现从语义互译到多模态合奏的跨越;远期则迈向“世界模型同构”,AI不再只是信息翻译者,而是能够在统一的认知框架中生成符合人类意图的理解与行为,从而达到意图共鸣。 从初期依靠算法和模型的突破,到中期依靠丰富的场景应用来推动落地,再到远期进入智能体生态,人类与AI在虚拟与现实的边界逐渐消解,形成共处共生的新格局。 物理AI:闭环驱动范式升维 五年演进趋势 新智能认知范式 三大模型的互补融合 计算效率提升 世界模型 从反应式到预测式智能 内在模拟与预测,赋予机器人"想象力",通过历史感知学习环境动态并进行预测推演 参数高效微调、模型压缩、异构计算硬件和实时调度优化,融合架构趋于分层实时 世界模型赋予预测编码能力,通过内部模拟预测感官输入、指导行为 认知与行动的深度耦合 泛化能力增强 具身智能模型 摒弃串行分离,转向感知-认知-行动闭环,形成自我完善回路 大规模多模态数据训练、跨本体学习提升、层次化泛化结构优化 物理交互与经验学习,强调通过实际身体与环境交互获取知识和技能 统一的智能体系结构 任务适应性与持续学习 VLA模型 世界模型+VLA+具身智能构成整体系统,视觉、语言、运动、推理协同 视觉-语言-动作的统一策略,将多模态输入融合为统一框架下的端到端训练 增量学习、小样本学习、人机在线交互学习、仿真与现实联合训练 人形机器人正从"能动"迈向"能用",实现真实场景下的自主智能 AI走向物理世界的自循环演化闭环 世界模型提供基底,具身模型承接感知与行动,VLA负责执行与协调,元宇宙作为试验与孵化环境,通过这一系列过程实现知识的不断更新。 全局性的“宇宙坐标系”,负责模拟与预测世界规律,为AI提供一个理解和预测环境的基础框架。 VLA作为中控系统,通过视觉、语言与行动实现“看—说—做”的多模态协同,负责AI的执行与协调工作。 元宇宙的虚拟演化试验场 具身模型的落地接口功能 低成本试错与加速演化的环境,AI在此进行试验与孵化,加速知识的更新和迭代。 将抽象知识转化为可操作的体验,使得AI能够通过感知和行动与现实世界进行互动。 AI自动化L1-L5:渐进提升全能自理 AI的发展不能只看作“自动化程度”的线性提升,而应理解为“人机关系”的渐进重构。 因此,所谓“全能自理”不应狭隘地理解为AI完全取代人类,而是人类与AI融合后的能力空间扩张。 这是从效率到创新、从代工到对话、从工具到生态的系统性跃迁。 最终目标不是“完全自动化”,而是“共生化”——人类与AI共同进入的新形态。 这种演化不是单一的技术逻辑,而是三重并进: Ø在技术层面,AI从计算走向理解,再到具备完整的世界模型;Ø在社会层面,人类从对AI的监督,逐渐过渡到信任与合作,最终形成制度化的共生契约;Ø在哲学层面,AI的自主性打破了传统的人类中心论,推动人类与AI共建“共体中心”,形成新的主体性格局。 哲思之光 天人智一:意识融合十倍效率 全民博导:赋能个体知识平权角 色 转 变 从 被 动 接 受 者→知 识 创 造者/传 播 者现如今,AI能力在若干高难基准上达到或接近专家/博士生水平,在此情况下,使用者必须要成为AI的博导,以指导博士生的思维去处理自身与其的关系。 全民博导 能力低于AI基准线-->提升能力达到基准线能力高于AI基准线-->实现指数级认知差异 知识平权研究/传播/创新 走向全民博导 人要当博导 开放获取/智能推荐/协作共享 当每个人都能以博导的思维驾驭AI,知识壁垒被打破,知识平权真正实现,人类将进入一个“赋能—创造—共享”的新阶段。 AI已是博士 AI技术底座