在2018年,Google Health和Alphabet的DeepMind发布了一份经过同行评审的论文,其中详细介绍了可以推荐以94%的准确性推荐治疗50多种眼病的AI系统。与Moorfields眼科医院NHS基金会信托基金以及伦敦大学学院(UCL)眼科研究所合作创建的基础模型表面上看待患者的比率与人类验光师相当。

现在,在《自然医学》杂志上发表的一项后续研究中,DeepMind声称其系统不仅可以准确地发现一种疾病-黄斑变性,而且可以预测该疾病在六个月内的进展。根据谷歌发布的白皮书,这是一个崇高的主张,该白皮书发现眼疾预测系统在现实世界中是不切实际的。这项最新研究的共同作者称该系统与人类专家相匹配或胜过人类专家,并指出该系统可用于靶向预防性治疗,甚至可以确定黄斑变性的新指标。

有足够的动机,尤其是考虑到通过眼睛分析AI可以准确预测糖尿病性视网膜病变和青光眼等疾病。黄斑变性是发达国家失明的主要原因。仅在美国,每年估计有148,000名成年人从早期轻度疾病发展为威胁视力的晚期疾病exAMD。一旦exAMD出现,视力就会急剧丧失,并且通常无法完全恢复,这使得从早期到exAMD的转换点成为疾病管理的关键时刻。

早期诊断

DeepMind和Google Health的AI从两个角度解决了预测exAMD转换的问题。它首先确定了转化的细微,早期迹象,然后对疾病的未来风险建模。

该系统基于3D光学相干断层扫描,使用光波拍照的成像测试来预测转化的开始-在这种情况下为湿性黄斑变性,其特征是视网膜下生长的血管和渗漏。视网膜。AI模型处理扫描并自动标记潜在的重要特征,然后另一个模型根据标记的扫描进行进度预测,而第三个模型采用原始扫描进行自己的预测。然后将这些预测合并以在六个月的时间范围内分配风险因子。

正如研究人员所解释的那样,第二种预测模型(用于原始视网膜扫描的一种预测)的纳入是受到研究的启发,该研究表明分割模型尚未捕获的特征,例如网状假性皮瘤(视网膜上的一种病变) )和组织反射率,表示早期exAMD转换的信号。对于六个月的预测窗口,选择该模型是为了使模型能够提前预测至少两个三个月的随访预约间隔,这是“临床可行的”时间量。

DeepMind的研究人员和合著者在英国七个不同的Moorfields卫生所对2795名患者(平均年龄为79岁)进行了测试,他们的一只眼睛被诊断出患有湿性黄斑变性。评估系统,其余部分用于评估经过全面培训的系统的性能。

与患病患者接受治疗的实际情况相比,该系统达到了运行特征曲线(AUC)(测试机为0.745,纯概率为1.0,完美模型为1.0的理想指标),为0.886,是模型质量的通用指标。但是在进一步的测试中,研究人员调整了敏感性(阳性阳性病例的比例;一般较高,更好)和特异性(假阳性比例;较低的样品为佳),以实现不同的临床结果,并考虑了就诊时间和治疗等因素。

例如,“保守”配置(90%的特异性,34%的敏感性)仅在9.6%的扫描中对应于假阳性(错误的预测),这可能会导致临床医生对大多数患者进行治疗。在“自由”配置下(特异性为55%,敏感性为80%),该百分比跃升至43.4%,这可能会使临床医生犹豫不决地进行治疗。

研究人员指出,在103名患者在研究过程中另一只眼睛经历转换的情况下,考虑到保守配置,在前6次扫描中,系统至少一次扫描产生了40.8%的真实阳性结果(准确的预测)个月。在自由派配置中,它预测至少有77.7%的时间是积极的。

在一个单独的实验中,研究人员试图将系统应用于最初六个月时间范围之外的预测。在保守和自由的配置下,分别有假阳性预测的所有眼睛的23.6%和25.8%是“早期”的,最终在预测后六个月以上就获得了转换。对于最初预测后至少有24个月随访的患者,保守配置下24个月内假阳性警报的数量为35.2%,自由配置下为32.8%。

人体基线

为了建立与系统性能进行比较的人类专家基线,研究人员随机选择了测试集的一部分,并在转换出现前的六个月中至少选择了一次扫描。对于每种情况,他们都有三名视网膜专家和三名验光师对眼睛是否会在六个月内转换做出两个预测:一个来自单次扫描,另一个来自扫描和伴随的历史扫描的预测,称为眼底图像的视网膜快照,以及患者的人口统计学信息和视力数据。

专家的表现胜于偶然,但他们的表现差异很大,单次扫描的灵敏度在18%至56%之间,特异性在61%至93%之间。如果提供其他信息,敏感性范围为8.5%至41.5%(有所改善),而特异性达到77.4%至98.6%。并且在所有预测中,专家在18%到52%的时间内都表示不同意见。

DeepMind表示,它的系统在平衡(即,不是过于保守或宽松)的配置下胜过大多数专家,可实现比五个专家更高的性能,并且可以匹配一个(验光师)用于单扫描任务。如果专家可以访问每位患者的先前扫描结果,眼底图像和其他临床信息,则DeepMind的模型再次胜过五位,而一个人(视网膜专家)的准确性与之相称。

未来的工作

尽管有希望该结果似乎可以预测眼疾,但研究人员承认仍有许多工作要做。

尽管用于培训,测试和验证系统的数据集是Moorfields眼科医院的具有临床代表性的人口统计学数据,但并不能完全代表全球人口。黄斑变性是多因素的,其位置,遗传,种族,性别和生活方式因素(例如吸烟和饮食)在风险中起着重要作用。而且,该系统仅在一种类型的扫描仪上进行了测试,这意味着它可能无法很好地适应其他设备制造商的扫描仪。它没有考虑治疗方案的差异以及与患者进行的扫描次数相关的其他因素,也没有考虑在扫描标记步骤中可能遗漏的组织特征。

也就是说,合著者认为他们的工作证明了AI在转换诊断中的潜力-特别是考虑到这不是一项常规的临床任务。研究探索了exAMD的各种预防方法,其中包括定期注射。但是,几乎没有证据表明临床医生-甚至是参加这项研究的专家-都能一致地预测患者即将发生的exAMD转换。

当然,如果该系统在投入生产之前要经过临床试验并获得监管部门的批准,则它必须克服缺乏鲁棒性和通用性的挑战。在上述白皮书中,由于眼睛筛选过程的变化而阻碍了Google系统的推出,从而导致视网膜图像质量下降。互联网连接不畅阻碍了事情的发展,患者对设置后续约会的谨慎态度也受到了阻碍。

Moorfields将是一个测试用例。得益于与DeepMind的较早协议,如果临床试验证明成功,则在最初的五年内,该医疗系统将能够在其所有30家医院和社区诊所免费使用AI。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。