在本周发表在《药物化学杂志》上的一项研究中,Google的研究人员与X-Chem制药公司合作,展示了一种通过物理和虚拟筛选过程相结合的方法来识别生物活性分子的AI方法。它导致了今天发起的“化学基因计划”的创建-Google加速科学团队与初创公司ZebiAI的合作,旨在使更多的小分子化学探针能够用于生物学研究。

谷歌表示,作为“化学研究计划”的一部分,ZebiAI将与研究人员合作,以鉴定目标蛋白质,并提供加速科学团队用于训练AI模型的源筛选数据。这些模型将对可商购的小分子文库做出预测-小分子化学探针不能用作药物,但可以选择性抑制或促进特定蛋白质的功能-将提供给研究人员进行活性测试,从而通过发现进行一些程序。

了解支持生命并产生疾病的生物网络是一项复杂的任务。一种方法是使用小分子。在生物系统(例如培养皿中生长的癌细胞)中,可以在特定时间添加它们,以观察蛋白质活性增加或降低时系统如何响应。

尽管化学探针在这种生物医学研究中非常有用,但只有4%的人类蛋白质具有已知的化学探针。为了隔离新事物,Google和X-Chem Pharmaceuticals转向了AI和机器学习领域。

正如该研究的合著者所解释的那样,化学探针是通过扫描靶蛋白中小分子的空间来识别的,以区分“击中”的分子,这些分子可以进一步测试。该过程的物理部分使用DNA编码的小分子文库(DEL),该文库在一个库中包含许多不同的小分子,每个小分子都附着在DNA片段上,充当该分子的“条形码”。一个会产生许多化学碎片,并产生一个共同的化学手柄。将结果汇总并分成单独的反应,在其中添加一组具有另一种化学处理的不同片段。

这两个步骤中的化学片段在共同的化学手柄处反应并融合在一起,它们被连接以为每个分子构建一个连续的条形码。生成文库后,可通过将DEL与蛋白质混合并洗掉不附着的小分子,来查找与目标蛋白结合的小分子。对其余的DNA条码进行测序可产生数百万个DNA片段的独立读码,然后可对其进行处理以估计原始DEL中数十亿个分子中的哪些与蛋白质相互作用。

为了预测任意选择的小分子是否会与目标蛋白结合,研究人员建立了机器学习模型-特别是图卷积神经网络,该模型用于为像小分子这样的图样输入设计。使用DEL进行的物理筛选为分类器提供了正例和负例,这样,筛选过程结束时残留的小分子就是正例,其他所有东西都是负例。

该团队使用DEL文库对三种蛋白质进行了物理筛选:sEH(一种水解酶),ERα(一种核受体)和c-KIT(一种激酶)。然后,使用DEL训练的模型,他们从药物发现平台Mcule和X-Chem的内部分子库中虚拟筛选了按需定制的大型文库,以鉴定出一组预测可显示与每个蛋白质靶标亲和力的分子。最后,他们将分类器的结果与随机森林模型进行了比较,该模型是使用标准化学指纹进行虚拟筛选的常用方法。他们报告说,分类器在发现有效候选者方面明显优于RF模型。

该团队在这三个靶标上测试了将近2,000个分子,它声称这是迄今为止最大的已发表的虚拟筛选前瞻性研究。

“我们很高兴成为此处所述的有效ML技术推动的Chemome Initiative的一部分,并期待其发现许多新的化学探针。我们希望Chemome能够激发重要的新生物学发现,并最终加速全世界的新治疗发现。” Google在博客中写道。“尽管必须做更多的验证才能使命中分子用作化学探针,尤其是对于特异地靶向目标蛋白和在常规测定中正确发挥作用的能力,但有效的命中是该过程中的一大进步。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。