研究人员将保护隐私的AI应用于大规模基因组研究
研究人员发表了一项关于将保护隐私的AI技术(同态加密(HE))应用于对基因和表型数据进行大规模,全基因组关联研究(GWAS)的研究。他们声称,它比最先进的方法快30倍,同时可以保护数据所属主题的隐私。该团队隶属于初创公司Duality Technologies,哈佛医学院和达纳-法伯癌症研究所,并于本周在《美国国家科学院院刊》(PNAS)上发表了研究结果。
GWAS可以提供对包括当前局势在内的多种疾病的洞察力,并且该技术目前正用于鉴定与易感性或对当前局势反应相关的遗传变异。但是像HIPAA这样的法规要求对某些医疗数据进行匿名处理以保护参与者的身份,而HE等技术正是在这种技术中出现的。
HE并不是新手,但近年来它已受到青睐,与计算能力和效率的提高相吻合。它基本上是一种加密形式,可以对使用算法(也称为密文)加密的明文(文件内容)进行计算,从而使生成的加密结果与未加密文本上执行的操作结果完全匹配。使用这种技术,“加密人”(例如,任何可应用于加密数据的学习型神经网络)都可以对数据进行计算,并将加密结果返回给可以使用加密密钥的客户端(从未公开共享)解密返回的数据并获得实际结果。
在PNAS发表的研究中,合著者开发了一个包含HE的框架,并证明了它可以对超过25,000人的数据集执行GWAS分析。它可以对所有个人数据进行加密,并且不需要用户交互,研究人员的推断表明,该框架可以在5.6小时内在一台服务器上评估100,000人的GWAS和500,000个单核苷酸多态性。(单核苷酸多态性是发生在基因组特定位置的单核苷酸的取代,与疾病,药物反应和其他表型相关。)
研究小组表示,该方法可以应用于其他医学研究领域,例如临床试验,药物再利用和罕见疾病研究。共同作者写道:“ [结果与宣称HE不适用于大规模GWAS的说法形成对比。”“因此,我们的[工作]在方法论和应用上都取得了重大进步,从而可以进行大规模的跨机构合作,以患者为中心的研究以及众包的基因组学。”
Duality由Alon Kaufman,主席Rina Shainski,图灵奖获奖教授Shafi Goldwasser,麻省理工学院教授Vinod Vaikuntanathan和开源先驱Kurt Rohloff博士于2016年共同创立。Vaikuntanathan是基本BGV同态加密方案的共同发明者,而Rohloff是Duality平台所基于的PALISADE HE开源库的创始人。
该公司保持低调,但主要从事银行等受监管行业的交易。其SecurePlus产品使多个方面可以进行协作,而无需暴露其数据或分析模型。即使在不受信任的云环境中进行分析时,数据也仍然受到端到端的保护,这要归功于“抗量子”技术,这些技术符合同态加密行业联盟制定的标准。