AI智能总结
——端侧大模型数据治理法律要点研究 中国信息通信研究院政策与经济研究所中国信息通信研究院互联网法律研究中心2025年12月 版权声明 本报告版权属于中国信息通信研究院,并受法律保护。转载、摘编或利用其它方式使用本报告文字或者观点的,应注明“来源:中国信息通信研究院”。违反上述声明者,本院将追究其相关法律责任。 前言 当前,数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。党中央高度重视通过数据基础制度建设释放数据要素价值。2025年10月23日,党的第二十届中央委员会第四次全体会议通过的《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》中明确提出,“健全数据要素基础制度,建设开放共享安全的全国一体化数据市场,深化数据资源开发利用。促进实体经济和数字经济深度融合,实施工业互联网创新发展工程。加快人工智能等数智技术创新,突破基础理论和核心技术,强化算力、算法、数据等高效供给”。 今年以来,随着人工智能技术加速向智能终端设备深度渗透,端侧大模型正以“算力前移、数据本地、场景深耕”的颠覆性变革重塑智能产业格局,形成覆盖智能手机、智能汽车、可穿戴设备等万亿级智能终端市场的产业生态。这场技术革命不仅催生出个性化语音助手、实时健康监测、本地化决策支持等创新应用,更通过“数据优先本地处理”的特性重构了隐私计算范式。然而,技术双刃剑效应在端侧场景有所表现。在数据保护层面,端侧大模型采集的生物特征、行为轨迹等敏感数据面临多重风险:一方面,模型逆向攻击技术可通过分析输出结果反推原始数据,芝加哥大学研究团队已成功从端侧语音合成模型的输出中还原出87%的原始声纹特征;另一方面,设备丢失或侧信道攻击可能导致本地模型参数泄露,进而暴露用户行为模式。更严 峻的是,端侧大模型降低了虚假信息生成的技术门槛,攻击者仅需单台终端即可伪造逼真的深度伪造内容。 自2020年起,中国信通院互联网法律研究中心已持续发布五本数据治理领域的研究报告,形成系列化成果。值此之际,该中心紧密结合端侧大模型技术的前沿进展与应用实践,精心编纂了第六本数据治理专题报告——《数据治理研究报告-端侧大模型数据治理法律要点研究(2025年)》。本报告立足部署在智能终端设备上的大模型所具有的独特技术架构与运行机理,系统剖析其在数据采集、存储、处理、传输及销毁等全生命周期环节中潜藏的风险特性,通过全面梳理国内外相关立法动态与实践经验,创新性地提出了一套兼具前瞻性与实操性的综合治理策略,旨在为打造安全可靠、合规有序的端侧智能生态环境提供有力的理论支撑与实践指引。 目录 一、端侧大模型发展概况与技术特点....................................................................... 2 (一)本地化:终端自治与数据保护升级........................................................ 2(二)轻量化:资源约束下的高效能突破........................................................ 3(三)个性化:用户行为驱动的场景智能........................................................ 3(四)协同化:端云融合与生态互联................................................................ 4 (一)数据处理前:“告知-同意”规则的适配............................................... 5(二)数据处理中:数据收集存储规则的效力.............................................. 10(三)数据处理后:用户数据权利的保护.......................................................11(四)处理全链条:数据污染与内容输出的偏差.......................................... 14 三、全球端侧大模型数据治理法律制度比较研究................................................. 16 (一)欧盟在严格保护个人数据基础上进行灵活处理.................................. 16(二)美国采取“场景化保护”灵活路径...................................................... 27(三)中国在现有法律框架下开展实践探索.................................................. 32四、展望与建议......................................................................................................... 37(一)完善法律规则,强化制度可操作性...................................................... 37(二)明确多主体责任划分,落实责任追溯机制.......................................... 39(三)补充监管手段,应对信息内容安全风险.............................................. 40(四)创新技术工具,提升以技管技能力...................................................... 41(五)建立协同机制,提升治理能力.............................................................. 42(六)加强国际合作,共同应对全球性挑战.................................................. 44 一、端侧大模型发展概况与技术特点 端侧大模型是指通过量化、蒸馏、裁剪等轻量化技术,将大模型核心推理能力下沉至手机、平板、车载设备、智能家居等终端硬件,依托本地算力完成数据处理、智能交互与任务执行,无需依赖云端持续支撑即可实现离线运行的轻量化AI模型体系,其核心价值在于平衡隐私保护、低延迟响应与终端算力适配需求。随着人工智能技术的快速发展,端侧大模型逐渐成为实现智能设备本地计算能力的关键技术,可在终端直接实现数据闭环与实时决策,具有本地化、轻量化、个性化与协同化等特征。 (一)本地化:终端自治与数据保护升级 端侧大模型通过隐私增强型计算架构和离线能力支撑两方面技术设计,实现了终端自治的功能,构建了完整的“数据-模型-服务”的数据安全闭环体系。一方面,端侧大模型能够突破网络依赖限制,在弱网或无网环境下提供稳定性服务,直接在终端实现功能支持。以北科瑞声手机端侧大模型为例1,其支持离线会议纪要生成与多语种实时翻译功能。端侧大模型这种本地化能力不仅优化了用户体验,还通过减少云端算力消耗降低了企业的运营成本。另一方面,端侧大模型通过隐私增强型计算架构可保障数据安全。如,部分智能手表类端侧大模型在实时监测心电数据时,功能分析完全部署在设备端,原始生理信号无需上传云端,可以在一定程度上避免数据泄露。 (二)轻量化:资源约束下的高效能突破 端侧大模型通过算法优化与硬件协同实现了性能提升,以突破终端设备在算力、内存和功耗方面的严格限制。一方面,通过量化、剪枝和知识蒸馏等核心模型压缩技术,在保证模型核心性能(精度、推理效果)能够有效发挥的前提下,降低模型的参数量、计算量与存储开销,实现模型的轻量化部署与高效推理,适配移动端、边缘设备等资源受限场景。另一方面,利用资源动态分配机制来优化资源使用效率。端侧设备的资源有限且异构,不同的设备在算力、内存、功耗等方面存在差异。资源动态分配机制可以根据设备的实时状态和任务需求,灵活地分配计算、存储和通信等资源,以提高资源利用率和模型运行效率。这种资源动态分配机制使端侧大模型在资源受限环境下仍能有效平衡性能与能耗。 (三)个性化:用户行为驱动的场景智能 端侧大模型通过分析用户的输入习惯、运动轨迹、生物特征等本地数据,在设备端动态更新知识库与服务策略,实现基于本地数据的深度个性化适配。一方面,端侧大模型依托本地部署低延迟的优势,深度挖掘具体场景下的实时交互数据、用户行为偏好及环境特征,通过持续迭代优化模型推理逻辑与适配策略,精准匹配场景核心需求,实现服务精准度、响应效率及适配性的全方位提升。以输入法场景为例,讯飞输入法的端侧大模型通过分析用户历史输入记录,在设备端构建个性化词库与预测模型,使候选词准确率较通用模型显著提升。在健康管理领域,华为WATCH 5设备搭载的“玄玑感知系统”整合 了多种生理数据,可实时分析用户健康状况并提供个性化建议。另一方面,端侧大模型凭借强大的多模态情境感知能力,可深度融合文本、语音、图像、设备状态及用户行为轨迹等多维度实时数据,精准捕捉场景核心需求与潜在偏好,不仅进一步拓宽了个性化服务的覆盖边界与体验深度,更推动服务逻辑从“用户主动触发的被动响应”,升级为“基于实时情境研判的主动预判与前置服务”,让个性化体验更具时效性、适配性与前瞻性。如,部分智能汽车的语音助理能根据用户日程推荐餐厅并提前预约充电桩,可分析驾驶者的日常路线、音乐偏好、座椅调节习惯等,生成定制化建议,还能根据天气或交通状况调整建议等;部分智能家居系统的端侧大模型可根据用户的作息规律、室内光照与温湿度自动调节设备运行状态,实现“无感化”的智能体验。 (四)协同化:端云融合与生态互联 端侧大模型依托精细化分层架构设计,实现了“端-边-云”三级资源的动态优化配置与高效调度,不仅最大化发挥各层级硬件资源的性能优势,更构建起各终端、节点间互联互通、协同运作的生态体系。一方面,通过对实时性任务与复杂任务的智能分流实现全域计算协同,其中,对时延敏感的实时性任务(如语音唤醒、障碍物检测、即时交互响应等)由端侧本地直接处理,可显著降低传输时延、保障服务流畅性;而算力需求高的复杂任务(如多模态语义理解、大规模数据训练迭代、高精度图像解析等)则智能分流至边缘节点或云端,借助更强算力支撑完成高效处理,形成“端侧响应快、边云算力足”的协同 闭环。另一方面,依托“端-边-云”分层架构搭建的互联体系,端侧大模型通过多设备智能互动进一步强化全域协同化效能。不同终端设备基于统一的协同协议与数据交互标准,可实现感知数据、任务结果、服务状态的实时共享与联动调度,例如智能家居场景中,端侧设备可同步环境感知数据,边缘节点统筹分配响应任务,云端优化全局服务策略,形成“设备联动-数据互通-任务协同”的闭环。这种多设备互动模式,既弥补了单一终端的算力、感知局限,又让各设备的功能优势形成互补,使“端-边-云”协同从“任务分流”升级为“全域联动”,大幅提升整体服务的响应效率、覆盖范围与适配精度。 二、端侧大模型数据治理法律要点分析 端侧大模型一定程度上是在基于受信任的隔离环境下进行部署和运行的,既能避免终端上收集和产生的数据过多与外部环境进行交互,又能在长期使用和学习的过程中,利用端侧数据将通用模型训练为高度个性化的模型。近年来,各类大模型密集部署,开始规模化应用于智能手机、个人电脑、智能汽车等智能终端设备,进一步强化了设备在图文等领域的处理能力,拓展了人机交互场景,能够更灵活地响应用户需求。但端侧大模型的数据处理方式相比传统云端模型更具隐蔽性、碎片化、场景化特征,且依托设备本地的多传感器、系统权限、离线交互场景,形成了