医学博士Eric J. Topol:您好。这是Eric Topol,代表Medscape上的《医学与机器》。我很高兴能有机会与斯坦福大学教授李飞飞进行更长时间的对话。她负责斯坦福大学以人为本的人工智能研究所(HAI)。多年来,她在人工智能(AI)领域产生了巨大影响,并且是我的英雄,而且同样是一位真正的朋友。欢迎您飞飞

李飞飞博士:谢谢埃里克。真是太好了。感觉是相互的;您也是我的数字医学英雄。

白杨:你很好。我知道我们将进行有趣的讨论,因为您已经在AI的人为方面投入了很多思想。今年早些时候,您在斯坦福大学开设了一家新学院。您能否背景介绍您这样做的原因以及它的立场?

李:您指的是斯坦福大学人类中心AI。它在许多方面都是新的,但也不是新的,因为在斯坦福大学和美国其他地方,不仅在AI技术的跨学科领域,而且在理解AI社会的人性方面,已经有大量研究在进行。以及人文影响,以及与医学,教育和许多其他领域的跨学科合作。

该研究所将所有这一切(我称之为历史关键时刻)综合在一起,在此十年中的第一次,我们看到了称为“人工智能”的计算机科学这一利基领域,并逐渐成为现实。生活。我们还看到它对人类生活和社会的影响正以其在这些行业各个领域的应用,产品和服务的巨大潜力而​​爆炸。

从技术的科学性,应用性以及对人类生活的影响上,我们都应该了解如何引导这项技术,这一点非常重要。

Topol:嗯,毫无疑问,在医学上,影响我们生活的AI问题更大。这就是为什么如此合适以至于您要在该研究所领导这项指控。

您是从多年前开始的一个名为ImageNet的公司,它随着时间的推移改变了这一领域。就各种扫描类型而言,无论是视网膜图像,心电图图像还是其他任何图像,医学界的许多人都不知道ImageNet是当今医学中正在发生的大事情的先兆。医学。但是从很多方面来说,它始于您启动ImageNet时。

您能告诉我们您当时在想什么以及在深度学习领域中导致了什么吗?

李:我在AI领域的专业领域是计算机视觉和机器学习之间的交集。早在2006年,我就致力于解决一个非常重要的圣杯视觉问题,这就是我们所说的“物体识别”。

如果您想到像人类这样的聪明动物,我们会以非常丰富的方式看到世界。但是,我们视觉智能的基础是识别周围数十万种不同的物体,无论它们是猫,树,椅子,微波炉,汽车还是行人。通过这种功能来启用机器智能是一个圣杯,现在仍然如此。

我们的领域正在努力。我是一位年轻的助理教授。那是我担任教职的第一年。我一直在研究这个问题,但突然间我意识到,当我们致力于那个时代的所有这些机器学习算法时,作为一个领域,我们正在处理来自几十个对象的非常小的一组数据类。该数据集每类大约有一百张或最多几百张图片,这与人类和动物所经历的真实世界形成鲜明对比。

我们受到人类发展的启发,认识到对大数据推动学习的巨大需求。它推动了不同模式的多样性,但是在数学上更重要,它帮助任何学习系统学习更好地进行泛化,而不是过度拟合不适用于大世界的狭窄得多的数据模式。

有了这种认识,我们认为,让我们做些疯狂的事情,那就是绘制出我们周围整个世界的物体。我们是如何做到的?我们受到最大的英语词汇分类法WordNet的启发,WordNet是由语言学家George Miller于1980年代发明的。WordNet有超过80,000个名词描述了对象的世界。

最终,我们获得了22,000个对象类,这些对象类是通过不同的搜索引擎从Internet下载的,并且通过Amazon Mechanical Turk开展了大规模的人群工程项目,这是该公司成立的头两年。我们吸引了来自160多个国家/地区的50,000多名在线工作者,帮助我们清理和标记了将近10亿张图像,最终得到了一个精心策划的数据集,包含22,000个对象类别的1,500万张图像,这些图像就变成了ImageNet。

我们立即将其开源给研究社区。从2010年开始,我们每年举行一次名为ImageNet挑战赛的国际竞赛,邀请世界各地的研究人员参与解决这一计算机视觉的圣杯问题​​。

几年后,加拿大的机器学习研究人员使用了相当传统的名为“卷积神经网络”的模型来赢得2012年ImageNet挑战。那是Geoff Hinton教授的小组。

我认为许多人认为ImageNet Challenge的工作是深度学习时代开始的里程碑式工作。

白杨:对。他们只是在今年早些时候获得了图灵奖或诺贝尔计算机科学奖。费飞,您还是把它们设置好了。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。