您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华为&中国信通院&中国移动]:通信行业人工智能数据治理实践指南2025:惟实励新 - 发现报告

通信行业人工智能数据治理实践指南2025:惟实励新

通信行业人工智能数据治理实践指南2025:惟实励新

引言 人工智能与数据的演进轨迹始终同频共振。从20世纪中叶符号主义开启人工智能的启蒙时代,到联结主义推动数据成为智能核心燃料,再到大模型时代数据与智能的深度融合,近一个世纪的技术迭代中,两者从并行发展的“双轨线”,到相互赋能的“共生体”,最终形成“DataforAI”与“AIforData”的螺旋式发展格局,深刻重塑了产业形态和发展主线。 数据智能浪潮正带来前所未有的挑战与机遇,通信行业作为信息社会的基石,数智化转型成为新阶段的核心命题。在此过程中,传统的数据治理工作模式和技术工具需要面向人工智能的需求进行一次全面的变革。要求通信运营商在高质量数据集建设和智能化数据治理方面的体系更为完善、技术更为适配、能力更为全面,同时可以相互赋能、深度融合。 本报告立足于国家《“数据要素×”三年行动计划(2024-2026)》与《关于深入实施“人工智能+”行动的意见》的战略指引,紧扣通信行业数据智能发展的核心诉求,深刻剖析了传统数据治理在面对大模型时代的数据需求时的能力短板,阐明了“DataforAI”与“AIforData”双轮驱动的实践框架:一方面聚焦高质量数据集建设,从业务转型需求出发,明确数据集建设的管理规范、技术路径与评测标准,为模型训练提供坚实数据底座;另一方面深耕智能化数据治理,详解人工智能在数据标准、质量、安全、元数据、资产管理等领域的应用 实践,实现治理效率与数据质量的双重提升。同时,报告通过典型案例,具象化呈现数智融合的落地成效,并创新性提炼可复制、可推广的实践经验。最后,报告前瞻性指出“数智一体化”“人机协同”“内生安全”三大发展趋势,为行业未来布局提供方向指引。 本报告融合了历史演进、理论框架、实践路径与前沿趋势,既立足当下破解行业痛点,也着眼长远引领发展方向,旨在为通信运营商及相关行业的数智化转型提供全面的人工智能数据治理的理论支撑与实操指南,助力行业培育新质生产力,在数据智能浪潮中筑牢核心竞争力。 编制说明 本指南的撰写得到了人工智能与数据治理领域多家企业与众多专家的支持和帮助,主要参与单位与人员如下。 参编单位: 华为技术有限公司中国信通院云计算与大数据研究所中国移动通信集团河南公司中国移动通信集团福建公司 指导组: 王福昌李伟中姜春宇王妙琼 参编人员: 蔡火发尹正崔一妍张鹏程田菁菁白琳叶紫光刘雪婷曹锐吴篁陈哲愚罗莹贝高林楼丕扬王溪 目录 引言.........................................................................................................1编制说明.................................................................................................3 二、通信高质量数据集建设指引......................................................17 (一)人工智能驱动通信业务转型............................................18 1.人工智能典型业务场景.......................................................182.人工智能典型智能应用.......................................................213.人工智能驱动业务转型价值分析.......................................22(二)通信高质量数据集新需求涌现........................................241.现有主要数据集基础...........................................................252.高质量数据集建设要求.......................................................263.高质量数据集建设难点.......................................................27(三)通信高质量数据集建设实践............................................291.高质量数据集管理...............................................................292.高质量数据集技术...............................................................31 3.高质量数据集评测...............................................................33(四)河南移动人工智能驱动智慧业务运营实践.....................351.持续开展数据治理,实现全过程强数................................352.人工智能赋能智能治数,提升数据运转效率....................363.数据治理驱动智慧业务运营全流程升级............................384.业务全链条注“智”,赋能业务效率提升............................39 三、通信智能化数据治理实践..........................................................41 (一)人工智能驱动数据标准智能化管理.................................411.人工智能驱动的数据标准管理带来的变化........................412.人工智能驱动的数据标准智能管理价值............................43(二)人工智能协助提升数据质量管理效率.............................441.人工智能对数据质量管理带来的变化................................442.人工智能数据质量智能化管理价值....................................46(三)人工智能赋能数据安全管理智慧化.................................461.人工智能赋能数据安全管理的变化....................................472.人工智能赋能智能化数据安全管理价值............................48(四)人工智能使能智能元数据管理转型.................................481.人工智能使能智能元数据管理变化....................................492.人工智能使能智能元数据管理价值....................................50(五)人工智能帮助提升数据资产管理能力.............................511.人工智能给企业数据资产管理带来的变化........................522.人工智能帮助提升数据资产管理价值................................52 (六)福建移动人工智能数据治理业务实践.............................54 1.深入开展数据&AI现状问题分析.......................................542.加强规划,建立多模态数据管理体系................................553.数据治理驱动AI+应用工作举措........................................564.人工智能原生数据治理使能数智运营实践........................58 四、通信数据智能发展趋势..............................................................62 (一)“数智一体化”能力体系................................................62(二)“人机协同”技术体系....................................................63(三)内生安全...........................................................................63 一、人工智能时代的“智”与“治” (一)分与合:人工智能与数据发展历程 人工智能与数据历史演进的轨迹横跨近一个世纪,从早期的两条平行线,分别受技术突破驱动,塑造各自领域的社会认知;到中期的逐渐交织,受应用和价值驱动,推动技术产业重塑。数据与智能最终走向融合。 1.人工智能发展历程——从“模拟”到“涌现” 纵观人工智能发展轨迹,其演进伴随技术突破与现实局限的交替,历经“三起两落”。崛起源于核心技术突破,沉寂归因应用落地瓶颈,最终在数据、算力、算法的协同演进中,实现了从“模拟人类逻辑”到“智能自主涌现”的跨越式发展。 “一起一落”:从符号主义崛起到第一次人工智能“寒冬” 符号主义核心是通过人工定义规则模拟人类逻辑推理,标志着人工智能从理论构想走向初步实践。作为人工智能的“启蒙时代”,其核心目标是构建能够复刻人类逻辑思维的“逻辑机器”。 但符号主义的崛起未能持续突破现实瓶颈,一系列固有缺陷导致人工智能进入第一次“寒冬”。核心问题集中在三个层面:一是规则局限性,面对复杂、不确定的现实场景,手动编码的规则库难以覆盖所有可能性;二是泛化局限性,领域专家知识的提取、编码成本极高,且难以规模化复制到不同行业;三是需求响应局限性,系统仅能处理结构化、符号化的明确问题,无法应对模糊性、非结构化的现实需求。 投资热潮的退去与应用落地的失败,使得人工智能领域陷入沉寂。这一阶段的困境也让业界意识到,单纯依赖人工规则模拟智能,难以突破人类认知与编码效率的双重限制,人工智能需要新的技术路径。 “二起二落”:从联结主义萌芽到第二次人工智能“寒冬” 第一次寒冬后,人工智能迎来技术路径的分流与复苏。一方面,专家系统在特定领域持续迭代,验证了专用智能系统的商业价值。另一方面,联结主义开始萌芽,核心导向从“人工规则”转向“数据统计学习”,人工智能逐步从“逻辑机器”向“数据机器”转型。 “数据驱动”展现出潜力,但技术发展再次遭遇瓶颈。核心制约因素集中在两点:一是算力制约,网络传输和芯片工艺制约了神经网络的规模扩张;二是数据制约,因场景和技术局限,当时的数据量级与多样性不足,无法支撑复杂模型的训练。 由于模型泛化能力有限,业界对人工智能的过高期待与实际应用效果之间的差距,商业价值未达预期,导致投资的收缩。这一阶段的沉寂并非技术方向彻底失败,反而让研究者认识到,人工智能发展对“数据、算力、算法”协同的迫切需求,为后续深度学习的爆发埋下伏笔。 “第三次兴起”:从大模型爆发到跨越式发展“前夜” 随着大数据技术成熟、算力指数级提升以及算法突破创新,人工智能迎来第三次崛起,核心导向从“专用智能”转向“通用智能”,实现了从“数据驱动”到“智能涌现”的质变,发展主线从“模型为中心”到“数 据为中心”。技术方面,参数规模化、多模态融合、提示工程等实现跨越式发展,模型不再局限于特定任务的优化,而是展现出上下文学习、思维链推理等“涌现”能力。 这一阶段,人工智能实