生物医疗领域隐私计算应用场景大揭秘

核心提示在数据的价值与安全性被认可与重视的背景下,如何在保证数据充分流通的同时不泄露用户隐私、合规合法地使用数据成为了一个重要的课题。而隐私计算的定义就是在数据提供方不泄露原始数据的前提下,对数据进行分析、计算的一系列信息技术,确保数据在流通和融合

在数据的价值和安全性被认可和重视的背景下,如何在不泄露用户隐私、合法合法使用数据的前提下,保证数据的全流通,成为一个重要的问题。隐私计算的定义是在数据提供者不公开原始数据的前提下,对数据进行分析和计算,以保证数据在流通和整合过程中的可用性、不可见性和未知性的一系列信息技术。与上述需求不谋而合。

隐私计算在中国起步较晚。经过几十年的验证、研发,以及充分的技术普及和市场教育,2016年,国内开始出现垂直隐私计算厂商。

2020年,国内隐私计算产品开始POC测试。2021年,隐私计算进入应用商业化元年,进入实施部署阶段的产品比例达到48%。

也正是在这两年,中国隐私计算行业的投融资事件持续增加,总数超过30起。IDC报告显示,2021年,中国隐私计算市场规模超过8.6亿元,未来有望实现110%以上的市场增长。除了传统的大数据,区块链、AI以及财富科技、趣链科技、同盾科技、星云等安全厂商,大型互联网公司、电信运营商、银行等金融机构也加入了隐私计算技术的研发。截至目前,国内已有88家企业陆续发布了私有计算技术产品,每年发布的产品数量均超过100款。

隐私计算包括多方安全计算、联邦学习和可信执行环境三种技术。在产业需求驱动下,正积极开展跨平台互联、可信硬件研发、软硬件一体化产品创新。在政策的支持下,其应用逐渐丰富。目前隐私计算技术的落地场景主要有金融风控、精准营销、政务服务、保险定价、医疗健康等领域。其中,金融领域的应用最为广泛,公共服务领域的应用比例增长强劲。

在过去的几年里,医疗行业的数字化取得了长足的进步,很多医院和医疗机构积累了大量的医疗数据,这为隐私计算的落地提供了良好的土壤。但是,医疗数据具有很强的隐私属性,对隐私保护和数据安全的需求更强烈。医疗数据的流通,一方面可以促进智能诊疗、医保自动化、新药研发等行业的发展,另一方面也可以促进现代医学研究、公共卫生防疫、临床医疗应用等方面的一些进步。基于此,生物医药将成为私有计算应用的下一个市场竞争点和爆发点。

对医疗数据流通和保护的需求激增。

医疗数据广泛存在,应用于日常生活的方方面面:比如通过大数据分析药物成分,寻找合理用药的最佳组合;通过基因测序,快速筛查和预测疾病,分析基因缺陷群体;远程诊疗、智能穿戴等场景。医疗数据一旦被篡改或破坏,将对医疗机构的声誉造成负面影响,并危及医患双方的隐私。

近年来,医疗领域的信息泄露、滥用和盗用现象时有发生。数据保护已经成为一种持续稳定的市场需求,而不是短期的监管反应。

2020年4月,世卫组织发表声明称,疫情期间遭受的网络攻击数量同比增长5倍,全球23.7%的APT攻击与医疗安全事故有关。中国首次超过美国和韩国,成为全球APT攻击的首要目标。在抗疫期间,新冠肺炎一些医学AI检测实验室的原始代码被黑客窃取并出售。同时,疫情期间逐渐接受远程诊疗,互联网医院在网上传播数据,加剧了诊断数据和信息的暴露风险。

政策方面,去年7月,《信息安全技术健康医疗数据安全指南》国家标准实施;《全国医疗机构网络信息安全管理办法》即将出台。今年2月,国家卫健委发布了一系列信息标准体系,建立统一的电子健康档案、电子病历、公共卫生等。,逐步实现了互联互通、信息共享、信息同步。跨机构医疗数据融合需求强烈,数据流通也是释放数据元素价值的重要环节。

在规定方面,现行的数据安全法和个人信息保护法明确了相关主体的义务,国家标准《信息技术健康医疗数据指南》已于去年实施。

隐私技术有望在保护医疗数据安全的前提下实现其合规流通和价值。截至目前,医疗健康已经占据了隐私计算11%的应用场景,医疗领域的隐私计算产品已经能够支撑大规模应用的实施。

实践中,医疗机构、基因测序机构、科研机构为数据提供者,医疗机构、科研机构、药学机构为数据使用者,通过隐私计算实现机构间数据互联,开展精准防疫、药物研发、辅助诊断、基因分析、临床医学研究等跨机构应用。

隐私在医疗领域的典型应用场景主要包括医疗机构间的数据共享和跨机构、跨领域的医疗数据开放。前者属于医疗机构、医药企业、基因测序机构、科研机构之间的横向场景,以增加建模的样本数量;后者包括保险公司、运营商、政府系统、互联网等外部数据。,以增加用于建模的样本特征。

临床等医疗场景落地。

目前国内外的应用案例基本集中在临床医学研究、基因分析、疫情防控等方面。联合风控、联合营销、医保赔付预测等场景也正在解锁。

例如,欧盟的“具有机器学习分类帐排列的药物发现”项目构建了一个具有分布式架构和联合学习功能的平台,可以使用许多顶级制药公司的数据来创建更准确的AI模型,以确定最有效的药物开发化合物。

英国的OpenSAFELY软件平台部署在英国两家最大的电子健康记录提供商的安全数据中心。通过分析电子健康记录的数据,在新冠肺炎疫情期间,该平台通过隐私增强技术分析了2400万患者的记录,并准确识别了与新冠肺炎相关的风险因素。

澳大利亚的Presagen公司致力于连接全球医疗数据,可以通过联邦AI算法帮助筛选试管婴儿胚胎,显著提高胚胎活力评估的准确性。

在国内,深证国家基因库与华大区块链联合开发的新冠肺炎基因组分析平台,基于区块链和多方安全计算的新冠肺炎基因组分析工具,助力数据共享和疫情防控。

在城市级实践方面,国内首个基于隐私计算的城市级医疗应用落地厦门。厦门健康医疗大数据应用开放实践,实现了对慢阻肺、糖尿病、NIPT相关儿童疾病、妊娠高血压、人群健康报告等课题的研究,有助于提高人工智能模型的准确性和鲁棒性,提高负担病例结构化的准确性和效率,辅助基层医生完成高质量的病例书写,提供检查、疾病诊断和用药的建议,提升基层医生的诊疗水平和市民在社区医院的首诊意愿。

在企业创新实践中,基于自身的资源和技术积累,隐私计算领域的创业公司主要采取两种定位:平台型技术产品和行业垂直应用。此外,集成技术企业、区块链企业、人工智能企业等各类科技企业也在进入市场。

比如行业初期成立的翼房建,一直是医疗、医保、医药+生物信息等子赛道的“排头兵”。在医疗领域,方毅健舒的核心产品包括医院使用的科研平台、智能病历管理系列解决方案、药企使用的药物研究平台、保险公司使用的医保平台、公共卫生使用的疾病控制平台。

大数据隐私计算平台后起之秀——罗外科技,在成立的第三年,已经完成了1亿元的B轮融资。在医疗领域,罗外科技推出了包括监管系统、数据节点管理、数据应用开发系统等可视化产品。、以及多中心隐私数据分析与建模、多中心目标条件隐私查询、带隐私保护的医学临床数据库等应用场景的解决方案。

此外,作为持续投资和布局隐私计算的大型科技集团之一,近年来,蚂蚁开始以其全球领先的专利技术提供隐私计算基础设施服务。在医疗领域,蚂蚁集团主要利用多方安全联合规则等解决方案,服务医保理赔、医院数字化运营、医疗保健临床辅助决策。

而性能和安全性阻碍了大规模应用。

目前,监管规则、性能瓶颈、安全标准、互联互通等仍构成通用隐私计算规模化的难点。但在医疗领域的应用中,这些困难被细化为一些更具体的挑战,限制了私有计算应用在医疗场景中的普及。

首先,应用场景和需求不够清晰。金融和信贷监管要求和需求更强,场景也相对清晰。而医疗数据包括病例、医嘱、CT图像、基因等类型,高度复杂,需要通过基因分析、图像草图、非结构化数据处理、统计分析等方法进行处理。

其次,配套的法律法规不健全。需要不断完善医疗大数据相关的法律法规,给予更多的监管指导,进一步解决个人医疗数据的隐私保护和隐私泄露,建立行业合作机制和开放共享。

三是性能有待进一步提升。对于海量医疗数据,隐私计算使用的密文需要突破计算和网络性能的限制。医疗领域联合计算的参与者更多,数据更多,对多节点的并发计算能力和准确性要求更高,甚至在新药研发、辅助诊断等场景中要求零误差。

最后,技术标准有待提高。在保证健康医疗大数据采集环节种类繁多、真正互联互通后,还应统一和完善数据采集的标准和规范,规范大数据的技术和管理。

随着医院间医疗信息的互联互通,医学专家对数据不出国的联合科研需求越来越大,这将加速医疗机构在隐私计算方面的投入。中国信通院所高级工程师白认为,未来隐私计算应该在以下几个方面进行探索。

探索医疗应用场景。通过隐私计算技术的工具,最大化数据融合的价值,丰富医疗数据的应用场景。可以从电子病历结构相对统一的医联体、医疗大数据中心入手,从科研场景入手,降低用户授权门槛。性能提升促进规模化应用。针对医疗数据的多样性,结合具体场景提升计算性能,通过通用算法流程优化、系统架构、硬件加速等手段提升规模应用。多技术集成加速应用。在计算的私密性下,多方安全计算、联邦学习、可信执行环境等分支技术的融合以及与区块链等其他领域的融合,可以拓展应用边界。为医疗场景制定标准。根据医疗场景的特殊性,针对具体场景编制相关标准,推进产品标准化和RD,辅以成熟的测试工具,将有效推动产品标准化和应用。

 
友情链接
鄂ICP备19019357号-22