AI智能总结
隐私计算 产业展望报告Qbitai Industry Insight 技术分析·价值延展·产业透视 量子位硬科技深度产业报告——隐私计算 核心结论 我们认为,隐私计算的想象空间不止于数据安全合规。作为目前能有效解决数据安全流通问题的唯一技术手段,隐私计算能够在业务价值提升、乃至社会生产力提高上有明显的放大作用。隐私计算不仅是一种工具,也不仅是作为IT底层的“隐私计算Inside”,而应当是联通价值网络的“隐私计算 all over”。 同时,我们也发现,隐私计算产业,虽然仍在早期的孵化落地阶段,但已呈现出了种种“竞争过热”的现象。 以下为本篇报告中,所提出与市场不同的分析结论: 1.隐私计算的价值分为三层,目前的价值来源于第一层的安全合规,但我们认为,其与AI/大数据产业的联动嵌入会成为其第二波增长动力。在未来,基于对数据要求安全流动,从而创造业务价值的影响,隐私计算将成为IT行业普遍应用的底层技术。 •行业本身的价值创造(数据合规;提升业务价值) •作为底层支撑,与AI产业及大数据产业协同发展 •推动数据要素安全流通,提升社会生产力。第三层价值回答了为何政策对隐私计算产业提供了高度支撑,也展示了这一技术目前的不可替代性,以及未来的巨大发展空间 2. 据量子位智库测算,预计到2030年,我国隐私计算行业的总市场规模将达到1134亿。其中,第一、二、三层价值分别占比11%,27%和62%。 3. 业界公认,隐私计算行业已经进入了“竞争过热”状态,产品供给远超意向客户及所需项目数量。玩家呈现出第三方初创公司、大型互联网公司、AI等软件开发商、转型公司、甲方自研参与的多方混战局面。尽管规划上已经有明显区分,但受限于资源和发展年限等,在具体落地上,企业的竞争战略和现有定位仍然较为同质化。我们预计未来3-5年内,将出现比较明显的差异化竞争路线。 量子位硬科技深度产业报告——隐私计算 3. 隐私计算行业还处于早期落地阶段,目前整体上处于产业点状落地期(2021-2025年),行业重点在于打磨头部客户及案例实践,预计2025年后可达到大规模商用的二次浪潮。 4. 行业入门门槛低、缺乏战略性的竞争差异、技术优势难以形成并证明是目前竞争过热的底层原因。扩展在产业链上的定位是玩家们未来的备选项之一。本报告基于分析给出了隐私计算产业未来的延展形态。 5.产品标准化平台化和基于数据运营的业务价值化成为竞争与发展的共同方向。 6.不同的分化路线已出现,但仍需进一步特色巩固,形成各公司可靠的战略优势,具体包含:数据生态服务商、软件系统服务商、专注垂直赛道、标准化完整方案、基础设施服务商、底层加速硬件厂商。其中,数据生态服务商已经成为绝大多数厂商的定位主张,但据观察,除专注特定赛道的厂商外,大规模的数据生态搭建仍需一段时间。 7. 要实现破局,需要强调的是隐私计算行业的综合门槛。主要涉及标杆客户、长期自研技术壁垒、连接能力、价值创造能力和产品工程化能力。 本系列报告感谢以下公司参与深度采访:冲量在线、洞见科技、锘崴科技、融数联智、华控清交、微众银行、富数科技、平安科技、星云Clustar、同盾科技、翼方建数、矩阵元、OpenMPC(排名不分先后) 目录 技术篇 01定义及分类02技术发展现状 价值篇 04技术价值分析07市场价值估算 产业篇 09行业供需现状 —供远大于需,现有行业天花板明显11代表玩家分析 —多方参与,现有落地路线相似,有待进一步分化17行业阶段划分 —仍需3年进入成熟阶段21产业链分析 —需从数据要素角度出发延展产业链定位24竞争过热背后 —同质化导致缺乏竞争壁垒25未来破局 —关注行业综合门槛 量子位硬科技深度产业报告——隐私计算 技术篇 1.1 定义 隐私计算并非特定的技术,而是近年提出的新技术概念,统指用于保护原始数据隐私的软硬件技术。在使用隐私计算后,使用者能够在不泄露原始数据、保护数据拥有者隐私及利益的前提下(如客户的具体身份),对所需数据进行采集加工、处理分析等。也即业界常称的“数据可用不可见”。 除去自有的“数据可用不可见”特性外,在辅以MPC、区块链等技术后,隐私计算还能够实现数据的“用途可控可计量”,并完善定价、确权等功能。在数据要素市场上,从底层的隐私保护出发,承接转移、交易、定价、确权等流程的技术需求。 目前多实现的典型功能包括: •隐私检索匹配:保护检索过程中的检索条件,在条件加密的情况下和数据库进行匹配•隐私推理:在保护个体信息的前提下,直接得到模型结果•隐私建模:连接多个机构的横向建模,这一功能在病人样本稀缺的医学领域表现突出 三大技术路线 在技术路线上,隐私计算大致可以分为联邦学习、多方安全计算和可信硬件三类。 在实际应用中,不同的场景、模型关注的技术指标不同(如安全性、准确性、并发性、响应速度等),而三类技术路线各自存在长短板,仅靠单一路线无法满足需求。因此,隐私计算公司不会将自身限定在某一特定路线上,而是选择全面布局,同时在专长的路线上形成技术壁垒。在实际应用中,基于对性能、安全性和准确性的取舍,对各类技术模块根据需求灵活部署。 量子位硬科技深度产业报告——隐私计算 最早由谷歌提出,用于利用用户手机进行模型训练。在进行机器学习的过程中,各参与方借助其他方数据进行联合建模,各方无需共享数据资源,本地原始数据不出库,对中间加密数据流通&处理,来完成多方联合的机器学习训练,建立共享的机器学习模型。该技术路线下仍然具有中心节点 *定义参考:微众银行2020年4月 《联邦学习白皮书2.0》、中国信通院云大所2021年7月《隐私计算白皮书》 *参考中国信通院云大所2021年7月《隐私计算白皮书》 1.2 技术发展现状 隐私计算技术相关的底层理论最早出现于上世纪80年代。密码学、零知识证明等分支技术在数据安全等领域均已有一定的商业应用,这也导致多家隐私计算初创公司脱胎于综合性厂商的相关技术部门,在技术商用落地上有一定的先发优势。 2020年起,隐私计算作为单独的技术门类,逐渐克服了安全、效率(如大量节点的并行计算、百万级数据规模)、可用方式(除加、减、比较外,开始支持逻辑函数、分类算法、甚至神经网络等)等技术门槛,进入点状落地阶段,并出现了对数据规模和延迟要求更高的生产级、城市级、基础设施级解决方案。 然而,尽管隐私计算技术已经有了明显发展,但依旧有些问题需要关注。 •不可能三角 在隐私计算中,由于需要大量的加密解密步骤,安全、效果、性能的三角往往难以平衡。 量子位硬科技深度产业报告——隐私计算 安全性 对客户而言,其中最为重要的是安全性,需要隐私计算产品进行充分的安全自证。在技术层面将更多的依赖于源代码自证、安全假设模型验证,以及POC和实际应用中的业务安全性证明。 模型效果 据公开资料,采用隐私计算后,银行的反欺诈模型AUC在0.6-0.7之间,约有20%左右的下降。但由于隐私计算可以为业务方引入外部数据,能通过增加数据维度及规模提升效果。据多家厂商预估,隐私计算能够实现10%以上的效果提升。 相关性能 值得一提的是,除了间接限制隐私安全实现的保护效果外,相关性能资源供给是否充足,甚至会直接决定能否采用隐私安全相关产品 •通信效率 隐私计算本身是用于解决小数据间的聚合和综合利用问题,通信更加频繁。特别是参与的数据及子模型会横跨不同机构、计算集群、乃至地区间,进一步提升了对通信的要求。 •计算资源 由于采用了密文,隐私计算的复杂度显著上升,算力消耗增加。据2021年的数据,在显著提升后,多方安全计算比明文计算仍慢约25倍。算力问题已被视作隐私计算产业大规模落地必须解决的底层问题。 •存储空间 •工程化能力 但在从业人员看来,相对于其在数据安全流通的开创性意义,现有技术缺陷不足以影响产业发展。 但同时,由于实际业务模型及系统、实际加密需求等和实验室/POC阶段的条件不同,要确保实际业务价值落地,工程化也是各公司的提升重点(如实际运算效率、可承载数据规模、多方通信效率等)。 量子位硬科技深度产业报告——隐私计算 价值篇 隐私计算元年2020过后,隐私计算从实验室阶段进入了点状落地阶段。POC数量、招投标项目、投融资数额的增加都证明着隐私计算行业市场的繁荣。 然而,在翻阅了市场现有的估值逻辑、访谈了业内人士后,分析师认为,市场上对于隐私计算价值的估计仍相对浅显。在本报告中,我们会对隐私计算的价值进行完整还原,试图呈现出这一产业的价值天花板。 2.1 技术价值分析 尽管现有分析和市场大多将隐私计算技术划归在数据安全合规技术内,但我们认为,这种视角限制了隐私计算的深层价值创造与应用场景拓展。 我们认为,业务价值驱动才是隐私计算的长期站位与关键价值。这一价值是与数据要素经济价值受到强调紧密相关的。在此背景下,隐私计算技术有望从一种单纯的安全保护技术转向经济价值创造的前提保护技术。 从本质来讲,隐私计算可以满足合规需求(跨境数据传输、个人数据的利用等),对应第一类场景。但我们认为,隐私计算的真正价值在于,与API调用、第三方沙箱、数据脱敏等此前的数据保护方式相比,隐私计算在保障合规安全的同时,为大规模、跨机构的数据流通创造了条件。也即第二、三类场景。 为此,我们将基于自身分析,对隐私计算行业的未来价值划分为三层介绍。尽管尚不明确延展价值的实现年限,但我们认为,基于政策导向、技术原理、以及目前的市场动向,隐私计算行业必将发挥出安全合规之外的业务价值。 量子位硬科技深度产业报告——隐私计算 由于我们基于隐私计算的价值功能进行分拆,与其他机构的价值分拆方式存在差别,我们在此提供其他机构的估算数据用于参考。 接下来,我们将基于自身逻辑,对隐私计算行业的多层价值进行拆分介绍。 第一层:行业自身发展——保护数据安全合规 从2018年欧盟GDPR(《一般数据保护条例》)开始,数据监管在全球范围内都有明显收紧。在我国,2019年全国范围对数据进行专项整治。合规政策方面,网安法、金融信息安全管理办法和条例、个人信息保护法、乃至今年落地的数据安全法,都是客户需求的核心触发点。 传统的数据交易方式,例如API(通过购买、合作、爬取等方式获得上游数据源,在清洗、融合等增值处理后,为下游提供统一数据接口)和数据包(统一清洗脱敏后,以类似excel打包的方式出售)已不再满足数据流通的安全合规需求。 据Gartner预测,到2023年,80%的公司要面对个人数据保护方面的强监管,这将极大的催生隐私计算行业在保护消费者数据安全方面的增长动力。 第二层:产业协同发展——嵌入大数据及AI产业的底层支撑工具 我们认为,隐私计算大概率会成为大数据产业及AI产业的底层基础设施。据Gartner预测,大型组织到2025年,60%会在数据相关、智能领域会采用至少一种隐私计算的技术。 在隐私计算的安全效果得到普遍落地验证,叠加相关政策要求后,隐私计算技术将会大面积被镶嵌入大数据平台/AI计算平台,由软件集成商或自研隐私计算技术的各大技术厂商对外打包提供。目前,多家综合性厂商的技术布局与产品开发已初步明确了这一趋势。我们甚至大胆假设,这种集成化的服务思路,未来也将成为隐私计算创企的延展业务矩阵的重要方向。 •大数据产业 如果我们以数据流转全生命周期为视角来看待隐私计算,由于会从根源保证数据的安全可用性,隐私计算将位于数据流动的入口,对接数据的计算层和使用场景,发挥承上启下的作用。 因此,隐私计算趋于成熟后,必将与大数据产业高度重合,全程参与大数据的交易、再加工、定价等环节。 量子位硬科技深度产业报告——隐私计算 对于大数据产业而言,一方面,隐私计算能够保证此前已经参与流通的数据价值,可以不受限于相关政策继续流通,也即维持原有的数据市场价值。而另一方面,隐私计算能够释放出此前不符合法规规定的数据价值(如政务数据)。我们认为,隐私计算带来这部分增量数据所带来的要素价值将远超此前的数据市场价值。因