您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[北京金融科技产业联盟]:数据要素背景下金融业数据治理新路径研究报告 - 发现报告

数据要素背景下金融业数据治理新路径研究报告

AI智能总结
查看更多
数据要素背景下金融业数据治理新路径研究报告

北京金融科技产业联盟2025年7月 版权声明 本报告版权属于北京金融科技产业联盟,并受法律保护。转载、编摘或利用其他方式使用本报告文字或观点的,应注明来源。违反上述声明者,将被追究相关法律责任。 编制委员会 编委会成员: 何军聂丽琴李琛琛 编写组成员: 孙伟吴晓渊顾羿煌李光耀董波李晓歌崔曦月陆燕朱颖宋文顶陶红兆刘通刘程琳隆峰张放温国梁孟萦卢翼李木子华桊兴赵亮肖体爱于宏亮刘丽丽卫少林刘绍华张海燕李振高强裔张澍何苗杨洋王旭东李培林睿陈承禹孙巨洋周元珂王艳艳孙振超张莹赵子凌杨祖艳靳晨杨景瑞黄勇刘志强 编审: 黄本涛国钰魏中宣 参编单位: 交通银行股份有限公司中国光大银行股份有限公司上海浦东发展银行股份有限公司中金金融认证中心有限公司中国邮政储蓄银行股份有限公司平安银行股份有限公司青岛银行股份有限公司北京国家金融科技认证中心有限公司中央国债登记结算有限责任公司新华三技术有限公司恒丰银行股份有限公司金电信息科技(北京)有限责任公司华控清交信息科技(北京)有限公司飞腾信息技术有限公司马上消费金融股份有限公司 目录 一、总体概述................................................1 (一)数据要素助推数字经济新发展............................1(二)数据要素背景对金融业数据治理产生深远影响...............1 (一)政策与标准............................................3(二)主要工作领域与内容....................................3 三、金融业数据治理面临挑战与机遇............................6 (一)问题与挑战............................................6(二)趋势与机遇............................................7 四、面向AI赋能的数据治理新路径............................10 (一)AI技术赋能数据治理的基本逻辑.........................10(二)AI赋能数据标准管理...................................11(三)AI赋能元数据管理.....................................12(四)AI赋能数据安全管理...................................12(五)AI赋能数据服务.......................................13 五、面向新领域的数据治理新路径.............................14 (一)面向非结构化数据资源的数据治理.......................14(二)面向AI模型的数据治理................................20(三)面向数据要素市场化的数据治理.........................28 摘要:《“数据要素×”三年行动计划(2024—2026年)》提出充分发挥数据要素的放大、叠加、倍增作用,在金融服务等12个领域试点数据要素的融合应用,赋能经济社会发展。在数据要素与金融服务相融合的背景下,数据要素加速实现市场流通的要求,以及人工智能等新技术的广泛应用对建立相应治理体系的紧迫需求,给金融业数据治理工作带来新的课题与挑战。 报告分析了新背景、新技术的应用对于改变传统数据治理领域工作范式和催生数据治理新课题、新领域两方面的影响,通过梳理金融业数据治理现状,比较行业实践案例与前沿理论动态,形成理论与实践之间的交叉验证,构建起数据要素新背景下金融业数据治理新路径的整体框架。 报告总结了AI技术赋能数据标准管理、数据安全管理等传统数据治理领域的路径。提出了面向AI模型与非结构化数据两大新领域的治理路径。报告阐明了数据要素市场化与数据治理工作的关系,对未来支持数据资源入表、数据要素加速流通的金融业数据治理做出展望。 一、总体概述 (一)数据要素助推数字经济新发展 党的十八大以来,我国数字经济快速发展,数字经济规模占国内生产总值(GDP)比重提升到40%左右,数字经济规模连续多年稳居世界第二。数据是数字经济发展的基础,数字经济与传统农业、工业经济的主要区别在于数据成为关键生产要素,数据要素的流通、共享、交易构成我国数字经济快速发展的源头活水。 2023年12月,国家数据局联合多部门印发的《“数据要素×”三年行动计划(2024—2026年)》(以下简称《行动计划》),提出充分发挥数据要素的放大、叠加、倍增作用,在金融服务、智能制造等12个领域试点数据要素的融合应用,推动数据要素与其他要素相结合,发挥数据要素乘数效应,赋能经济社会发展。《行动计划》的出台,将进一步促进数据要素在相关行业和领域的广泛应用,推动数据要素驱动经济社会高质量发展新态势的形成。在此背景下,探讨面向人工智能的数据治理、面向数据要素市场化流通的数据治理等关键课题,尝试构建金融业数据治理新路径,对于推动落实《行动计划》、促进金融服务中数据要素的价值释放具有积极意义。 (二)数据要素背景对金融业数据治理产生深远影响 数据要素与金融服务相融合的政策导向,一方面将对金融业数据要素的价值释放形成有力推动,另一方面,大数据、人工智 能等新兴技术的广泛应用,促使金融机构对完善相应的数据治理体系产生了更为紧迫的需求。 1.改变传统数据治理领域工作范式 在数据要素新背景下,金融机构广泛将人工智能技术应用到数据治理领域中,赋能数据标准管理、元数据管理、数据质量管理、数据安全管理等子领域,改变了这些领域原有的工作范式与路径,使得这些领域数据治理工作的效能得到显著提升。 2.催生数据治理新领域 在“金融+数据”深度融合的政策导向下,金融机构将机器学习和深度学习模型应用于客户营销、风险防控等业务领域,借助其强大的数据处理和建模能力开展经营决策、推动业务发展。在这一背景下,如何建立覆盖AI应用全生命周期的治理体系,有效规避AI模型开发、部署、使用过程中可能产生的数据安全、数据质量风险,更好地发挥AI模型的业务价值成为金融机构面临的新挑战。同时,持续迭代的AI模型、不断扩充的AI算力只有在与其能力相匹配的数据集相结合时才能产生促进数据价值释放、推动金融业务发展的效果,这就要求金融机构将数据治理拓展到非结构化数据,实现AI算力与计算对象之间的高效供需匹配。这些背景共同催生了AI模型治理、非结构化数据治理等新领域。 二、金融业数据治理现状介绍 金融业是典型的数据密集型行业。建立完善的数据治理体系,对数据要素开展系统性的治理,对于金融机构的数字化转型与高质量发展具有重要意义。 (一)政策与标准 《中华人民共和国银行业监督管理法》《银行业金融机构数据治理指引》等法规与政策,为银行等金融机构的数据管理工作提供了指导原则,明确了流程和目标要求。我国金融机构数据治理工作主要遵循国际、国内成熟的数据治理框架,典型的如数据管理能力成熟度评估模型(DCMM模型)、DAMA数据管理框架等,见图1。 (二)主要工作领域与内容 金融机构开展数据治理工作的领域一般包括: 1.数据标准管理 数据标准管理的目标是使金融机构的数据遵循统一的业务规范和技术标准,确保数据的一致性与可比性。数据标准管理是金融机构开展数据治理的起点。目前金融机构已普遍开展数据标准管理工作,包括建立企业级字典规范、开展数据贯标、确立主数据等。 2.元数据管理 元数据管理的目标是通过对业务、技术、管理元数据的盘点、集成和共享,建立数据资源目录,为金融机构提供全面了解机构数据资源的窗口,帮助金融机构明确数据的来源、去向和使用情况,为其他治理活动提供基础。金融机构开展元数据管理的主要活动包括元数据采集、元数据质量检核,构建企业级数据资源目录、推动数据资源目录开放共享等。 3.数据安全管理 数据安全管理的目标是保护数据隐私和安全,防止数据泄露和滥用。金融机构开展数据安全管理的主要活动包括建立数据安全策略与标准,结合监管部门要求与机构实际划分数据类别和安全等级,建立基于分类分级的数据访问与使用权限体系,定期审计数据安全等。 4.数据质量管理 数据质量管理的目标是保障数据的真实性、准确性、连续性、完备性和及时性,数据治理的成效在很大程度上是通过数据质量 的高低来反映的。金融机构开展数据质量管理的主要活动包括确定质量管理目标和控制机制,制定数据质量监测体系,编制数据质量检核规则,开展数据质量问题整改,定期进行数据质量评估等。 三、金融业数据治理面临挑战与机遇 (一)问题与挑战 1.数据复杂度和多样性不断增加 近年来,随着大数据、人工智能等技术的应用,企业数据应用所涉及的数据类型逐渐从传统的结构化库表、基于库表简单加工的指标和标签等数据资源延伸到包括长文本、图片、音频、视频等在内的非结构化与半结构化数据。 相较于结构化数据具有明确的治理路径与步骤,不同类型的半结构化、非结构化数据有不同的处理技术与使用需求,往往有各异的管理目标与使用路径。因此,面向结构化数据的标准管理、元数据管理、质量管理、安全管理等治理领域,大多无法直接简单搬用至半结构化、非结构化数据,数据治理工作复杂度显著提升。 2.数据资产化进程相对滞后 金融机构的数据资产管理包括数据资源化、数据资产化两个过程。 数据资源化主要是从控制性视角出发,将原始数据纳入统一的数据标准、数据质量、数据安全等管控体系的过程。在数据资源化方面,当前多数金融机构已建立了较为完善的管理体系,在落实数据贯标、提高数据质量、保障数据安全方面形成了相对成熟的管理办法与实施路径,使机构内数据资源满足成为数据资产的基础条件。 数据资产化是从价值性视角出发,通过丰富资产应用场景、持续运营,使数据资源凸显、释放其经济价值、以生产要素的形式参与市场流通的过程。在数据资产化方面,许多金融机构还未形成成熟的管理思路,机构建立的数据目录与实际的数据应用相割裂,缺少数据应用地图;没有按照应用场景对指标、标签、算法模型等数据资源做分类并定期根据其使用情况开展成本、收益的评价与核算,尚未形成支持数据资源会计入表、数据要素市场化流通的价值管理基础。 (二)趋势与机遇 1.人工智能全面赋能传统数据治理 人工智能赋能的数据治理,是传统数据治理领域充分借助AI应用能力,在自动化、实时化、智能化等方面的自我演进。当前,金融机构业务持续发展,机构数据量加速增长,在此背景下,实现新增数据迅速纳管,按照流程及时落实数据标准、数据安全、数据质量等领域的管控要求,势必对治理活动的实时化、自动化程度提出更高要求,也成为数据治理活动主动寻求与AI能力结合的契机。 与治理活动深入开展相伴的,金融机构的数据资源也将加速沉淀,如何实现存量数据资源的“唤醒”与盘活利用将成为机构面临的新问题。大语言模型强大的文本生成能力,能够有效支持数据资源元数据向数据知识、数据智能的自动化抽取、转换,并 基于此提供数据资源的智能化检索与问答服务,有效提升机构数据治理活动的智能化水平与业务价值。 2.数据治理支撑金融业人工智能应用 AI应用过程中在数据层面的管理和控制活动,是人工智能技术发展驱动产生的数据治理新领域,对于金融业AI场景的成功落地具有重要的支撑作用。当前,如何解决、控制AI发展中遇到的数据储备不足、数据质量难以保障、数据安全风险等问题已越来越多地引起行业的讨论与关注。建立涵盖AI治理的,能够推动金融机构AI应用高质量、可持续发展的数据治理体系已成为重要议题。 3.数据治理促进数据要素市场化流通 数据要素市场化流通对于促进金融机构数据资源的高效配置和价值释放具有至关重要的意义。然而,绝大多数数据具有可复制性、非标准化等特点,