您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[医渡云]:基于隐私保护计算的医学研究应用 - 发现报告
当前位置:首页/行业研究/报告详情/

基于隐私保护计算的医学研究应用

医药生物2021-08-28-医渡云看***
基于隐私保护计算的医学研究应用

数据治理与安全在线峰会隐私计算实践论坛2021.08.28,09:00 -17:302021DataFunSummit 蒋锦鹏!"#$%&'(|基于隐私保护计算的医学研究应用DataFunSummit2021 CONTENTS目录背景与挑战Background&Challenge01隐私计算技术PPC Technology02医学科研需求Medical R&D Requirements03医渡云解决方案Yidu's solution04| 版权© 2021医渡云保留所有权利01背景与挑战 版权© 2021医渡云 保留所有权利|健康医疗需要更好的数据融合应用与数据科研价值挖掘各类医学研究及AI模型训练需要数据支撑,研究者正进行各种形式的数据合作多中心研究相比单中心在科研中有着不可替代的优势数据融合后的核心优势整合多中心的临床资源,在一定范围内扩大研究样本量,促进临床资源共享多中心的数据包含不同区域样本,降低数据有偏,研究成果泛化能力更强随访、死因、体检、可穿戴设备、生活习惯等数据在并不在医院,需要数据融合扩大科研样本量消除或降低数据有偏性补充非临床数据 版权© 2021医渡云 保留所有权利|合法合规的解决数据孤岛难题已是行业挑战医疗数据孤岛引起的协同难、效率低、溯源难是数据科研价值挖掘不可回避的难题医疗数据融合需要满足隐私保护和数据要素市场发展的双重需求院间依然存在数据孤岛,合作审批协调难、操作流程长数据孤岛难题处处可见隐私保护法律法规相继出台各类多中心研究方案依然采用人工录入方式、耗时长、效率低人工参与的转录过程,难溯源链路不完整、少质控2019年10月十九届四中全会决议通过,增列“数据”为生产要素2020年3月 中共中央国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》2020年5月,多位两会代表提议加速医疗数据要素市场培育政策推动数据要素市场培育2018年5月25日欧盟《 通用数据保护条例》GDPR2018年6月28日《加利福尼亚州消费者隐私保护法案》CCPA2021年6月10日《数据安全法》2021年8月20日《个人信息保护法》 版权© 2021医渡云保留所有权利02隐私保护计算技术-数据可用不可见 版权© 2021医渡云保留所有权利|隐私保护计算技术开启数据融合应用新思路隐私保护计算是通过计算机技术手段合规打破“数据孤岛”的有效方案多方安全计算和联邦学习在安全性和AI应用角度更具优势197019801990200020102020多方安全计算姚期智等同态加密秘密分享可信执行环境差分隐私联邦学习1982姚期智提出,解决多参与方在无可信第三方且互不信任情况下,各自持有输入,共同完成计算过程,同时无私有数据泄露。1978Rivest1979Shamir2016Google提出,应用于私有数据保护下,完成联合机器学习,得到全局模型由硬件层提供安全保障结果不准确安全性弱通用性安全性联邦学习多方安全计算可信执行环境差分隐私专用性 版权© 2021医渡云 保留所有权利|揭开多方安全计算与联邦学习的神秘面纱联邦学习提供了新思路:让羊群(模型/参数)在各地移动,而草(数据方的数据)不出本地,主人(需求方)无法知道它吃了哪些草多方安全计算在不可信环境下完成了可信运算:基于秘密分享的多方安全计算利用秘密分享的原理对原始数据随机分片(原始数据加密),在随机分片上进行计算,最后参与方共同计算出结果(结果解密)集中机器学习or传统分布式机器学习联邦学习直观的基于“Secret-Sharing”实现的多方安全计算的例子AliceBobCharlie 版权© 2021医渡云 保留所有权利|隐私保护计算产业欣欣向荣隐私增强计算入选Gartner 2021九大重要战略科技趋势金融, 31互联网, 18政务, 16医疗, 12通信, 10其他, 13行业应用分类金融、互联网等数据智能驱动型行业成为隐私保护计算最热行业医疗、政务也在积极试点1927373544380%20%40%60%80%100%截止2021 H1截止2020 H2研发阶段试点阶段实施阶段40+主要国内厂商5+国外活跃厂商8+主要开源项目6+贡献较多高校5+主要标准化组织数据来源:信通院隐私保护计算大会披露及调研数据来源:Top Strategic Technology Trends for 2021 Gartner认为,到2025年将有一半的大型企业机构使用隐私增强计算在不受信任的环境和多方数据分析用例中处理数据。 版权© 2021医渡云保留所有权利|隐私计算在医疗领域的应用登上《Nature》封面隐私计算在医疗领域的应用场景《Swarm Learning for decentralized and confidential clinical machine learning》德国波恩大学的研究人员联合惠普公司以及来自希腊、德国、荷兰的多家研究机构共同开发了一项结合边缘计算、基于区块链的对等网络协调的分布式机器学习方法——群体学习(Swarm Learning,以下简称SL),用于不同医疗机构之间数据的整合。研究人员基于1.64万份血液转录组和9.5万份胸部X射线图像数据,使用SL为白血病、肺结核和肺部疾病、COVID-19开发疾病检测分类器,发现SL在满足保密规范的同时优于单个医疗机构开发的分类器。算法识别出患病个体的准确率,在血液转录组数据集中平均为90%,在X射线图像数据集中表现为76%-86%。 版权© 2021医渡云保留所有权利03医学多中心科研对安全计算的需求特点 版权© 2021医渡云保留所有权利|数据归一标准化数据后结构化数据汇聚数据深加工数据质控数据映射数据清洗数据对照患者EMPI数据脱敏数据同步数据备份各类医学研究及AI模型训练需要数据支撑,研究者正进行各种形式的数据合作医疗领域-数据需求更严苛隐私计算技术是通过计算机技术手段合规打破“数据孤岛”的有效方案多方安全计算和联邦学习在安全性和应用角度更具优势敏感度更高"数据不出院"要求强烈高质量、标准化需要以数据治理为基础一套完整的疾病标准数据治理解决方案已为全国500家医疗机构服务和支持信任鸿沟分布式架构,数据严格不出院共建全国疾病科研网络,当前已参与建设16家国家临床中心,覆盖20个疾病领域Pain pointOurpower就诊检查基因数据消费借贷通信数据敏感度更高?HIS电子病历检验检查放疗ICU手麻护理临床数据随访记录疾病转移康复情况疾病复发随访数据生物信息数据组学数据生信分析WGS分析HLA分型生物样本数据复杂依赖数据治理 版权© 2021医渡云 保留所有权利|医疗领域-计算需求更复杂支持常用的安全统计方法20+搭建跨院安全互联通道优化调度、通信算法抽象出通用的计算模式灵活组合Pain pointOurpower患者纳排本地:抽取,预处理安全:聚合,排序患者纳排本地:过滤安全:统计本地:局部统计方案调整统计分析复杂的本地计算与安全计算组合反复出现统计分析与联邦学习AI建模并存可解释性要求更强跨机构间通信网络条件差算力、资源分布严重不均统计分析更受青睐可解释性更强机器学习侧重点不同跨行业需大量改造才能复用无算力、资源差算力好,资源好不通网有算力、资源差 版权© 2021医渡云保留所有权利04医渡云多方安全计算解决方案 版权©2021医渡云保留所有权利|服务多中心研究的医渡云多中心医学研究全场景解决方案IIT临床研究开展I-IV期药械试验与研究诊疗技术开放推广患者随访与管理多中心科研协作平台(Saas)国家临床医学研究中心平台(NCRC)医渡云多中心医学研究全场景解决方案HIS电子病历检验检查放疗ICU手麻护理临床数据随访记录疾病转移康复情况疾病复发随访数据生物信息数据组学数据生信分析WGS分析HLA分型生物样本库!"#$A!"#$B!"#$C%&'()*+,%&'()*+,-./012-./012-.3456789-.3456789统计结果进行展现多方安全计算平台专病库院内外业务系统1套疾病标准数据治理3种多中心研究协作形式4大应用场景 版权© 2021医渡云保留所有权利|多方安全计算为多中心研究保驾护航医渡云多方安全计算解决方案隐私计算节点分中心机构1数据分中心机构2数据分中心机构3数据医院端数据不出医院,各节点对其拥有的数据有绝对控制权所有数据调用经过多方安全计算框架可审计隐私计算平台应用端隐私计算应用框架形成标准数据集形成标准数据集形成标准数据集任务下发加密联邦统计、建模平台端基于密码学的多方安全计算技术,传输中间参数,安全性得到密码学论证,无患者隐私、医院敏感数据泄露发起计算任务计算结果呈现临床研究Feasibility平台大样本量队列管理平台疾病预测模型训练平台研究应用管理应用节点管理存证溯源助力NCRC建设提效多中心协作产品化界面多中心网络建设多中心研究协同A院PIB院PI激励分配密态中间参数交换密态中间参数交换任务下发任务下发结果输出联邦模型训练和预测安全审计决策树神经网络比例风险回归联合统计分析描述性统计单因素分析相关分析多因素回归生存分析...贡献度计算加密联邦统计、建模加密联邦统计、建模逻辑回归安全审计安全审计联盟区块链 版权© 2021医渡云 保留所有权利|医渡云多方安全计算解决方案安全计算在数据科研协作应用过程中保护多方数据权益隐私保护计算应用框架-Yidu MANDA多方安全计算联合统计隐私集合求交(PSI)匿踪查询(AQ)...安全联邦学习Feature EnginingLogistic RegressionXGBoost...联盟区块链存证留痕安全溯源全面监管...隐私保护基础技术差分隐私混淆电路不经意传输零知识证明秘密分享同态加密可信执行环境...医疗应用场景...医疗机构/疾病联盟研究者制药等企业研究者政府研究者/ 监管者数据规范应用数据规范应用临床研究Feasibility调研大样本量队列疾病预测模型基因组数据分析医学数据治理能力数据采集隐私处理安全处理数据清洗医工结合数据加工标准化后结构化医学知识图谱数据质控数据源质量评价数据填充评价数据标准化评价 版权© 2021医渡云 保留所有权利|医渡云多方安全计算解决方案卓越的安全性保障中国信通院授予医渡云两大证书隐私保护计算技术实力和行业影响力获赞!Feldman秘密分享(t,n)•Shamir秘密分享基于半诚实安全模型•Feldman可验证秘密共享(VSS),安全性更高升级的可验证秘密分享子协议保证密码学理论视角的安全可靠专业机构中国信通院测评报告背书工程实现视角的安全可靠安全性保证:•基础协议保证< t个参与者无法恢复秘密可以抵抗被动攻击和以下两种主动攻击•分发者在秘密分发协议发送错误碎片给部分或者全部参与者•协议参与者在秘密重构协议中提交错误碎片 版权© 2021医渡云保留所有权利|2021年4月11日医渡云携手清华大学启动重要基础研究课题以期解决智慧医疗产业发展中面临的难点问题医渡云多方安全计算解决方案n多方安全计算技术技术能够在保障数据安全的前提下,显著提升多中心科研效率。但此过程中涉及大量加密和通信操作,限制了应用范围和使用效率。这便是“联邦学习和安全计算性能优化研究”课题开展的意义所在。n除联邦学习和安全计算外,课题组专家认为,区块链作为多方安全计算技术的监控和认证保护,其去中心化、不可篡改等技术特性,将进一步增强多方安全计算的安全储存和可溯源性,对于医学临床试验以及真实世界研究都极具价值。1.联邦学习和安全计算性能优化研究2.基于区块链的医疗数据存证溯源共享机制研究3.基于Agent的疫情传播仿真平台及政策研究 版权© 2021医渡云 保留所有权利|医渡云多方安全计算解决方案技术优势与特点020301支持多通道安全算法可插拔摆脱网络瓶颈保证计算实时性多业务可以隔离并行处理,通过多通道实现更细粒度的优先调度本自研引擎优化通信解决随参与方数量增加,MPC通信开销二次增长的网络瓶颈最大化算法场景优势抽象安全计算API,提供安全协议可插拔和按需选取的能力 版权©202