报告专家组成员 卢延纯国家发展和改革委员会价格成本和认证中心主任 杜平国家信息中心原党委书记 常务副主任 于施洋国家信息中心大数据发展部主任 刘刚国家发展和改革委员会价格监测中心副主任 王威江西省发展和改革委员会 数据局 党组成员 王耀文深圳市政务服务和数据管理局副局长 李红光深圳交易集团党委委员 副总经理 深圳数据交易所党支部书记 董事长 王磊中国光大银行深圳分行副行长 王一鸣北京大学经济学院金融学系主任 教授 博士生导师 杨东长江学者 中国人民大学法学院教授 博士生导师 校人事处处长 杨翰方中国人民大学统计学院教授 林常乐清华交叉信息核心技术研究院常务副院长 宋鹏程西安交通大学数字经济讲席教授 海南数据交易有限公司董事长 报告起草组成员 组长: 王建冬国家发展和改革委员会价格监测中心副主任 赣州市委常委 副市长 副组长 王冠深圳数据交易所有限公司副总经理李琳粤港澳大湾区大数据研究院常务副院长刘屾赣州市行政审批局 政务服务和数据管理局 党组书记 局长 报告起草组员 按姓氏拼音排序 : 何荣胜 吕指臣 李颖 聂怗 孙晋 孙湛 熊伟巍 杨铭鑫 虞洋 案例研究组员 按姓氏拼音排序 : 江祖松 林余楚 李旭东 伍簙侃 肖国泉 钟毅 案例支持单位 深圳市福田产业投资服务有限公司深译信息科技 珠海 有限公司江西冠英智能科技股份有限公司开普云信息科技股份有限公司赣州市智能产业创新研究院 一 研究问题的提出 数据是继土地 劳动力 资本 技术之后的第五大生产要素 是基础性资源和战略性资源 也是重要生产力 我国经济社会发展沉淀的数据总量所催生的数据资产潜在市场规模十分巨大 据中央网信办调查1 2022年我国数据年产量8.1ZB 1ZB=270字节 占全球10.5% 数据要素已超过技术要素 成为仅次于资本的第二大贡献生产要素 2023年11月 在国家发展改革委价格监测中心等上级部门支持协调下 深圳数据交易所 粤港澳大湾区大数据研究院 中国人民大学交叉科学研究院 交叉信息核心技术研究院 清华大学 等单位共同启动了 粤港澳大湾区数据要素评估计价中心 建设 本报告是该中心启动组建后形成的首部公开研究成果 旨在通过对数据资产 数据流通交易产品等数据要素形态价格问题研究回顾的基础上 构建较为完整统一的数据要素评估计价理论体系 并结合深圳数据交易所相关行业实践进行案例介绍 以期对下一步行业研究提供有益借鉴 二 不同视角下的数据要素评估计价 一 资产评估视角下的数据要素评估计价 从资产评估视角看 按照中国资产评估协会印发的 数据资产评估指导意见 评估方法包括收益法 成本法和市场法三种基本方法及其衍生方法 成本法是将在当前条件下重新购置或者建造一个全新 状态的评估对象所需的全部成本 与合理利润 减去各项贬值后的差额作为评估对象价值的评估方法 成本法估值一般使用于尚无活跃公开交易市场其直接收益预测有一定难度的数据产品 其优势在于操作相对简单 但存在无法充分反映数据的未来潜在价值 且过度依赖成本数据等问题 收益法是通过测算数据资产未来带来的经济效益 并利用折现率计算至当前时点的价值总和 从而得出数据资产的价值 收益法相比成本法能够更好体现数据资产真实价值 更易被数据需求者所接受 但由于数据资产的预期收益年限 折现率等参数在设定上经常难以统一 这一定程度上降低了该方法的客观性 此外考虑到数据价值难预测 易波动 通过收益法确定数据资产价值的公允性有待进一步提升 市场法通过参考公开交易市场中活跃交易的同类可比产品价格 进而确定待估数据资产的价值 对于存在合法合规的 公开活跃交易市场 并且存在足够数量可比案例情况下较为适用 但是 当前数据交易市场正处于发展初期 场内数据交易频次和规模较小 寻找同类可比产品难度较大 二 流通交易视角下的数据要素评估计价 在流通视角下 当前我国各地已成立或推动成立近50家数据交易场所 为数据买卖双方提供了一个公平 公正 公允的价格博弈环境 基于博弈理论的定价更关注数据价格的形成过程而非数据价值评估本身 更有利于解决多方利益关系 信息不对称的问题 博弈定价主要包括基于非合作博 弈 non-cooperative game 的定价模型 基于Stackelberg博弈的定价模型 基于讨价还价博弈的定价模型三类2 非合作博弈 non-cooperative game 指参与者之间不建立合作关系 只设定使自身利润最大化的价格 如Luong N C等3在其研究中将一个物联网数据交易市场建模为一个非合作博弈模型 并提出相应价格策略 讨价还价博弈在数据交易市场中 主要表现为买方和卖方就数据商品的价格需经过协商博弈后达成一致 这一方式被广泛应用在复杂条件下的谈判 其主要缺陷在于需要耗费大量时间和资源 可能导致交易效率低下 Stackelberg博弈是一种序贯博弈 在博弈过程中存在领导者和追随者两类角色 领导者首先作出定价决策 并充分考虑追随者可能的反应 而追随者则再基于领导者的决策优化自己的决策 最终确定最优定价策略 Jung K等4搭建了一个两阶段的Stackelberg博弈模型来解决数据需求者的定价和购买问题 Liu K等5搭建了 一 个 两阶段的Stackelberg博弈模型来解决数据需求者的定价和购买问题 这一模型主要困难在于数据拥有者需要确定一个价格领导者 数据交易所作为数据交易集中发生的空间 能够及时地反映数据交易真实的供需关系 作为价格领导者具有一定的公允性 三 新技术视角下的数据定价 数据价格形成是一个跨信息学 经济学等学科的综合性问题 因此需要利用人工智能 联邦学习等新技术新方法推动数据要素的动态化 智能化价格形成6 通过梳理相关研究发现 主要聚焦三个研究方向 一是模拟仿真数据动态定价 即允许企业根据实时需求为商品或服务设置灵活的价格 价格将根据供需变化 竞争对手的价格以及其他市场情况进行调整 相关学者运用基于模拟数据或真实交易平台上的数据 神经网络 强化学习等方法研究数据智能定价 Smartdatapricing SDP 7问题 旨在采用可变价格激励用户调整其互联网访问行为 二是基于维度模块评估数据价值 此类研究旨在通过机器学习方法直接或间接评价数据价值 如倪渊等8在提出数据价值评估指标体系的基础上 构建AGA-BP adaptivegenetic algorithm-back propagation 神经网络模型 沈俊鑫等提出了基于模型堆叠集成GBDT GradientBoostingDecisionTree 算法的数据资源价值评估方法9 三是机器学习模型类产品的价值评估 Cong Z等10认为要从机器学习模型构建步骤出发 从原始数据集 数据标签形成 多方协同训练三个过程综合讨论其价格问题 ChenL等11基于 数据销售商—中间商—模型产品购买方 的交易 流程 提出了一个基于模型的机器学习 amodel-basedpricing,MBP 定价框架 三 数据要素评估计价的对象和基本原则 一 数据要素评估计价的对象 数据一般不直接以原始形式直接进行流通和交换 而是需要经过加工 整理和优化 形成一种具有明确应用场景和使用价值的产品后参与交易和流通 目前数据交易市场上的交易标的主要分为数据产品 数据工具和数据服务等产品形态12 从数据开发利用的层级来看 2020年12月 国家发展改革委 中央网信办 工业和信息化部 国家能源局联合发布 关于加快构建全国一体化大数据中心协同创新体系的指导意见 以下简称 指导意见 指出 要 完善覆盖原始数据 脱敏处理数据 模型化数据和人工智能化数据等不同数据开发层级的新型大数据综合交易机制 按照 指导意见 要求 参照信息理论对信息价值的分类 在数据要素市场建设中 按照流通 交易数据要素的价值深度 可明确为四种要素形态 图3-1 二 数据要素评估计价的基本原则 数据要素评估计价应遵循公正性和高效性两大基本原则 以形成健康 高效的数据价格体系 公正性主要包括三个维度 议价公平 过程合规 价值合理 议价公平 即确保议价活动在公平公正的基础上进行 所有相关方都能访问到过程中的关键信息 促进信任和公平竞争 价值合理 即定价应真实反映数据资产的内在价值 确保价格与其价值相匹配 过程合规 即在定价过程中应严格遵守数据安全 资金安全 保密管理和隐私保护等相关法律法规 确保定价活动不仅符合市场需求 也符合法律和道德标准 高效性原则 主要包括三个层面的内容 一是定价机制应设计得足够灵活 便迅速响应市场动态和变化 保持流程的高效率 消除信息的不对称 减少不必要的延误和成本 并能够根据市场变化 技术进步和用户需求进行调整 二是应该保持定价机制的公开透明 让市场参与者能够清楚理解定价依据和过程 也要以市场为导向 即基于市场供需情况 反映数据的实际价值和使用场景 避免人为干预 三是应鼓励数据的高效流通和利用 减少交易成本 提升资源配置效率 并设计有效的激励机制 以便通过合理的定价激励数据提供者和使用者 促进数据的创新和应用 四 数据交易价格形成的基本流程 2024年7月 深圳数据交易所公开发布 深圳数据交 易所定价服务指南 1.0版本 从数据交易的角度 构建了 估价-报价-议价 的交易定价流程 在此 我们进一步丰富完善了数据的交易价格流程 即数据产品交付后最终的价格认定 一 估价 交易所估价形成建议价 交易所可通过数据探查 引入第三方评估机构结果等方式 结合交易平台历史交易数据生成数据交易价值评估结果 基于评估结果 交易所通过定价模型生成估价 并将估价结果反馈至数据商 作为数据商定价参照的重要依据 二 报价 数据商报价形成初始价 数据商或数据提供方根据自身的预期价格和交易所提供的参考建议价 在交易所对相应的数据产品进行报价 此报价成为数据产品最终展示价格 数据商可以选择直接采纳交易所的估价或基于自身情况和估价结果自行报价 三 议价 买卖双方议价形成成交价 数据产品的最终成交价由买卖双方通过协议决定 交易所提供交易撮合和议价环境 但最终的成交价格由市场行为决定 反映了供需双方的共同意愿 动态调整机制方面 随着市场的发展和历史交易数据的积累 估价模型会不断优化 更贴近市场实际 初期可能依赖于信息增益算法 随着时间推移 会逐渐引入更多的非信息增益算法 如独立性权重法 秩和比法 因子分析法和层次分析法等 以更全面地反映市场行为 四 价格认定 交易事后开展数据产品价格的认定 数据产品交付后 在进行数据产品价格认定时 主要遵 循以下逻辑步骤 首先 根据数据产品的种类 特性及其在市场中的功能 如数据的来源 处理方式和应用场景 制定清晰的价格评估标准 包括数据的市场价值 替代成本和使用价值等 进一步 通过市场调研收集同类数据产品的价格信息和交易案例 分析市场供需状况 将成交后数据产品价格与市场上相似产品的价格进行比较 识别出价格异常的情况 同时 结合影响价格的外部因素 如法律法规 市场竞争状况 技术进步等 收集数据产品所有者 使用者和第三方专家的反馈 了解各方对目前价格的看法 增加价格认定的客观性 最终形成数据产品的价格认定 此外 应建立持续的监测机制 充分考虑价格的波动性 定期评估数据产品的价格和市场变化 五 数据交易定价的典型案例 交易流通环节 数据产品 数据工具和数据服务等产品形态存在不同的市场成熟阶段 而不同开发层次的数据 在定价方法选择上亦存在差异 原始数据由于其未经处理 加工 开发 现阶段实践中较少用于交易流通 在此不做案例介绍 一 脱敏化数据产品 1阶 深译信息科技 珠海 的人工录制多语言语音语料数据集和多语言多领域文本语料数据集 为较为典型的人工智能大模型语料数据集产品 通过收取数据使用费的方式获取收益 该类数据产品成本主要集中于数据采集 存储 清洗和标注的成本 且成本投入直接影响到