人工智能挑战旨在提高乳腺摄影的准确性
乳腺钼靶筛查广泛用于乳腺癌的早期检测。但是,乳房X线照片目前依赖于人类的主观解释,因此,筛查过程并不完美。例如,在美国,此类筛查估计会导致10%的假阳性,这会增加患者的焦虑感,并可能导致不必要的干预或治疗。
深度学习的进步和不断增强的计算能力最近重新引起了人们对使用人工智能(AI)来提高筛选准确性的兴趣。为此,数字乳腺摄影(DM)DREAM挑战赛采用了众包方法来开发和验证可改善乳腺癌检测的AI算法。目标:评估这种算法是否可以匹配或改善放射线医师对乳房X线照片的解释(JAMANetw。Open 10.1001 / jamanetworkopen.2020.0265)。
由IBM Research,Sage Bionetworks和Kaiser Permanente Washington Research Institute共同指导的DM DREAM挑战是迄今为止最大的针对自动乳房X线照片解释的深度学习性能的客观研究。“这项DREAM挑战赛允许在两个独立的数据库中对数十种高级深度学习算法进行严格而适当的评估,”DREAM挑战赛总裁贾斯汀·古尼(Justin Guinney)解释说。
这项挑战要求参与者开发算法,以输入乳腺X线筛查数据并输出分数,该分数代表女性在接下来的12个月内被诊断出患有乳腺癌的可能性。在一个子挑战中,该算法还可以访问以前的筛查检查得到的图像以及临床和人口统计学危险因素信息。
挑战的数据由美国的Kaiser Permanente Washington(KPW)和瑞典的Karolinska Institute(KI)提供。KPW数据集包括来自85,580名妇女的144,231次筛查检查,其中1.1%为癌症阳性,被拆分用于算法训练(70%)和评估(30%)。KI数据集仅用于算法验证,包括68,008名女性的166,578项检查,其中1.1%为癌症阳性。
为了确保这些数据的私密性,两个数据集均在防火墙后得到了安全保护,挑战参与者无法访问。相反,参与者将其算法发送给组织者以在防火墙后面进行自动培训和测试。
众包竞争
这项挑战由来自44个国家的126个团队组成的1100多名参与者接受了。在第一阶段,对算法进行了训练并根据KPW数据进行了评估,并使用AUC(一种衡量算法连续评分将阳性和阴性乳腺癌状况分开的程度的度量)来评估和评价算法性能。