编写组 指导委员会 编写组主要成员 专家委员会 彭靖芷杨易侗马宇诗徐甲孟令宇梁兴洲何紫荆苏向文阿里研究院 AI 治理中心专家阿里安全生态合作负责人阿里安全高级体验设计专家上海人工智能实验室安全可信 AI 中心上海人工智能实验室安全可信 AI 中心上海人工智能实验室安全可信 AI 中心上海人工智能实验室安全可信 AI 中心上海人工智能实验室安全可信 AI 中心 薛晖袁媛王迎春阿里巴巴集团科技伦理委员会委员 & AAIG 主任阿里研究院院长上海人工智能实验室 邵晓锋闻佳俞思瑛钱磊胡侠阿里巴巴集团风险管理委员会主席阿里巴巴集团公共事务总裁阿里巴巴集团首席法务官阿里巴巴集团安全部总裁上海人工智能实验室 张荣傅宏宇李娅莉洪海文沈晖陈岳峰胡俊英黄龙涛杜东为阿里云智能集团通义安全负责人阿里研究院 AI 治理中心主任阿里巴巴达摩院法务安全负责人阿里安全御风大模型负责人阿里巴巴达摩院安全总监阿里安全 AIGC 安全算法负责人淘天集团法务部法务专家阿里安全资深算法专家淘天集团营销法务负责人 关于我们 编写单位 • 阿里巴巴人工智能治理与可持续发展研究中心(AAIG): AAIG 是阿里巴巴集团旗下的人工智能研发团队,致力于利用 AI 技术解决安全风险问题,并推动 AI 技术更加安全、可靠、可信赖和可用。团队成员在计算机视觉、自然语言理解、数据挖掘与网络安全等领域的国际顶级会议和期刊上发表论文 100 多篇,获得国际国内专利授权 60 余项,申请中专利 200 多项。AAIG 贯彻“科技创新是最好的网络安全”的理念,所研发的人工智能产品涵盖内容安全、业务风控、网络安全、数据安全与算法安全等多个领域,为集团在全球的千万商家和十亿消费者提供更好的安全和体验。 • AI45 中心: 上海人工智能实验室安全可信 AI 中心是上海人工智能实验室科研任务部门之一。团队以 "Make Safe Al”为核心技术愿景,着力夯实人工智能内生安全技术基座,推动行业从“让人工智能变得安全”到“打造安全的人工智能”的转变,支撑人工智能朝着有益、安全、公平方向健康有序发展。 关注我们 特别鸣谢 彭骏涛段然杰朱琳洁杨锐黄昱恺李进锋张强王铮况育宇徐璐妮许晓东廖伟宋月冉邵晓钰许继杰陈宇宁王筱玥田晶晶郑子熠 AAIG 公众号 目录 CHAPTER03 人工智能发展和安全的总体趋势 守己:坚持长期主义保障模型及应用安全。公共云提供了AI应用安全的可靠保障方案 1 对人工智能发展与安全的总体判断20 1建立技术先进、能力完备的模型安30全体系 1.1 AI 全球化发展是世界的主旋律,开源开放成20为中国 AI 创新的重要路径1.2 大模型发展转向应用侧,需配套模型、数据、21网络等全方位的安全能力1.3 安全需要多方合作,共绘 AI 安全与性能平衡21发展的美好愿景 1.1 AI 范式在推理深度、模态广度上快速更迭,31安全技术要跟上智能技术的发展1.2 围绕“守己”理念,阿里巴巴建设了评测牵41引、内外兼备、能力全面、技术领先的 AI 安全体系 2对人工智能安全的基本态度242.1 守己242.2 利他252.3 合作26 CHAPTER04 利他:用开源建生态、用开放促普惠,负责任地评估应对AI发展中的影响 1构建开源开放生态,加速技术的普惠80和发展 1.1 开源开放生态的利他属性801.2 基于开源生态的 AI 应用服务851.3 负责任的开源生态风险治理88 3.1 AI 对经济社会的影响1053.2 AI 对商业的影响1073.3 坚持长期价值建设,引导 AI 技术应用向上110向善 2 大模型是世界知识的产物,也是服务97世界的工具 2025 年,人工智能技术持续快速跃进,不仅深度重构数字世界,更以前所未有的广度介入物理世界。不断提升的模型能力打开了人们对智能应用更大的想象空间,发展的重心也向产业上下游延伸。以“AI+ 云”为引擎加速推动计算资源、基础模型与应用生态的全栈发展,并驱动人工智能服务走向全球化,带动“技术 - 产品 - 市场”的正向循环。 上海人工智能实验室聚焦人工智能发展与安全战略性、前瞻性需求,联合国内外学研力量,持续深化人工智能领域关键核心技术攻关,探索通用人工智能路线,引领推动我国人工智能科技创新与产业创新深度融合;同时,通过战略性项目布局持续催生重大科学突破,让人工智能深度赋能国家建设,助力全球发展。 随着人工智能在千行百业的渗透普及,各方不仅期待人工智能的能力变得更强,而且更加关注其对人类社会带来的各类影响,期望推理、多模态等前沿技术以及智能体等应用更加负责任。国际社会日益形成共识:安全与发展并非对立,而是“一体两翼”。我们既要保障技术创新、形成智能红利,又要合理管控风险、保障人类安全,守护安全底线、尊重人的尊严与权利,并接受多方主体的持续监督,让人工智能做到合伦理、有克制、不伤害。“守己”是负责任人工智能技术的必要前提条件。 在此进程中,开源开放正成为构建可信 AI 的关键路径。2025 年,中国已成为全球开源大模型生态的重要贡献者。开源不仅降低了技术门槛,更通过代码透明、社区协作与敏捷反馈,推动安全知识的公共化与治理能力的集体进化,提高了社会对人工智能的信任,一个由开发者、企业、社会组织、公众与主管部门共同参与的信息透明、敏捷反馈、多方协同的治理生态正在形成,使人工智能在高速发展中仍能获得及时、有效、包容的约束与引导。“利他”代表了对负责任人工智能技术的更高要求。 知行合一,理念终归要落地于实践。“守己”与“利他”的价值主张,正内化为领军科技企业战略布局的核心原则。 作为“AI+ 云”战略的实践者,阿里巴巴坚持守己、利他的负责任创新,贡献更好、更安全的全栈人工智能技术,提供更多样、更有温度的智能应用服务,促进行业可持续发展;并通过模型开源、标准共建与跨国对话,与全球伙伴共同定义负责任人工智能的技术规范与实践路径,让人工智能在向好、向善的轨道上行稳致远,服务全球。 对人工智能发展与安全的总体判断 1.2 大模型发展转向应用侧,需配套模型、数据、网络等全方位的安全能力 1.1AI 全球化发展是世界的主旋律,开源开放成为中国 AI 创新的重要路径 大模型技术的发展推动从算力到智力的转化,推理能力的提高让大模型能够分析理解指令要求、执行复杂任务,多模态的发展让大模型具备了更强的现实认知能力,大模型正在接管数字世界,改变物理世界。2025 年以来大模型的产业应用渗透加速,伴随 Agent 的普及,大模型进一步激活用户数据、重构传统软件,人类正步入智能经济的时代。 大模型技术问世以来,如何控制 AI 风险、保障 AI 安全成为各国关注的重点。美、英等国家相继设立国家级 AI 安全研究机构,例如美国 AI 安全研究所(现称“美国 AI 标准与创新中心”)、英国 AI 安全研究所,聚焦前沿风险研判;欧盟通过《AI 法案》构建基于风险分级的监管框架;我国则创新性建立“备案 + 检测 + 评估 + 标识”四位一体的大模型全生命周期治理先进实践,在鼓励创新的同时保障安全。我国的相关法规、标准、实践指南体系完备,覆盖大模型事前事中事后阶段,并得到充分落实,使得公众对大模型技术的信任度高,反映出治理有效性与社会接受度的良性互动。 大模型发展的重心也走向应用侧,需要持续推出能力更强、效率更优的模型,更需要围绕用户和场景构建应用生态。大模型安全治理进一步向用户侧延伸,围绕模型应用落地过程中的实际问题,重点保护用户数据权属和隐私、保障用户对模型的控制、促进 Agent 的有序协同。AI 应用安全需要模型、数据、网络等全方位的安全能力,公共云既能提供最先进、最安全的模型,也能够为用户使用模型提供全面保障,是模型应用的最佳解决方案。 2025 年以来,大模型技术在推理、多模态等方向持续突破,成为了世界知识的入口和各行各业通用的工具。法国率先在巴黎 AI 行动峰会提出了推动 AI 发展的诉求,美国特朗普政府则废止了 AI 安全行政令,提出以持续高速创新和技术应用扩散为目标的 AI 战略构想,中东、日韩、东南亚等国家也积极拥抱 AI。国家层面对 AI 的关注从模型、算法、算力延伸至电力、网络等基础设施以及人才、资金等资源支持,以提高模型能力为重心、支持 AI 全栈技术的协同发展成为共识。 1.3 安全需要多方合作,共绘 AI 安全与性能平衡发展的美好愿景 统筹 AI 发展与安全,是 AI 治理的核心要务,也是我国的成功经验。风险伴生于发展,AI 的发展具有高度的动态性。AI 的风险也具有阶段性,AI 技术的完善在不断降低其本身的风险,对此企业一方面需要在发展的过程中积累科学依据和实践经验,理性地判断 AI 前沿科技创新带来的风险,避免过早、过急、过重的外力治理,另一方面通过凝聚政产学研各方的力量,在 AI 技术发展和应用拓展的过程中同步建立风险判别和处置机制,提前发现、识别风险,通过技术手段加以修复、应对,采取多方合作的方式将负面影响降至最低。 2025 年 6 月 25 日,国务院总理李强在第十六届夏季达沃斯论坛开幕式上指出:“中国创新具有明显的开放、开源特征,我们愿意向世界分享原创技术和创新场景,也支持国际联合研发、应用推广,通过开放合作促进各国创新发展。”我国持续推出高质量开源模型,使用门槛不断下降,将 AI 的能力源源不断地转化为生产力。我国开源衍生模型数量全球最多,集聚全球开发者力量、多元化技术路径发展、多样化应用生态开源成为了 AI 发展的核心路线。 在 2025 年世界人工智能大会(WAIC)科学前沿全体会议上,图灵奖得主杰弗里·辛顿(Geoffrey Hinton)在与上海人工智能实验室主任、首席科学家周伯文教授的对话中指出,“让 AI 更聪明”和“让 AI 更善良”会有不同的技术,而国家之间可以分享“让 AI 更善良”的技术。“让 AI 更善良”一直是中国人工智能企业和科研机构对负责任 AI 技术的追求与希冀。在 2024 WAIC 上,上海人工智能实验室周伯文主任率先提出“AI-45°平衡律” (AI-45° Law)的技术思想,强调人工智能性能与安全应协同演进。这一判断从长期主义视角提出 AI 安全与性能的应然关系,描绘了人工智能安全与性能协同演化的总体愿景。 人工智能安全既需要持续的安全投入,也需要凝聚各方共识与技术合力,共同推进安全技术成果的积累与落地。在中国人工智能治理实践中,政府、企业、科研机构正在走向敏捷协同,共同推进安全能力共建与风险知识共享。上海等地政府监管部门主动推动治理模式创新,通过平台建设、服务匹配等方式支持和帮助 AI 企业提升安全素养、构建安全能力,培养全社会负责任地使用 AI 的意识,推动 AI 安全可信发展。 全球合智方能全球善“智”。《人工智能全球治理上海宣言》倡导建立全球范围内的人工智能治理机制,鼓励国际组织、企业、研究机构、社会组织和个人等多元主体积极发挥与自身角色相匹配的作用,参与人工智能治理体系构建与实施。面向未来,中国人工智能企业与科研机构有信心为全球人工智能治理提供前沿技术能力,让人工智能真正成为造福人类的国际公共产品。 2对人工智能安全的基本态度 2.2 利他 负责任的模型开源,建设资源开放的生态,实现普惠、促进安全、繁荣生态,是 AI发展的重要路径。开源文化孕育了技术创新和进步的基本范式,而开源 AI 则从代码自由走向资源开放。模型开源使得技术更为普惠,让更多的人能够低成本用上最优秀的模型,通过使用积累经验、降低试错成本,产生众人拾柴火焰高的效果,是技术向善的自觉选择,同时开源生态帮助连接技术与市场,满足产业多样化的应用需求,促进技术赋能千行百业。在安全侧,开源模型的技术风险和闭源模型相比并没有新的增量,我国对模型事前备案以及事中事后的检查、标识,以及产业界采用的评测等方案,可以有