一种人工智能加速药物发现虚拟筛选平台(RosettaVS)

来自公众号:AIDD Pro本文以传播知识为目的,如有侵权请后台联系我们,我们将在第一时间删除。

今天给大家讲一篇2024年8月在Nature Communications上发表的一篇关于虚拟筛选的文章。作者提出了一种基于结构的虚拟筛选方法(RosettaVS)用于预测配体与受体之间的对接姿势和结合亲和力

。该方法在多种基准测试中优于其他基于物理的虚拟筛选方法。此外,作者以泛素连接酶靶标KLHDC2和人体电压门控钠通道NaV1.7两个靶标为例,对包含数十亿化合物的库进行了筛选,并在七天时间内筛选了多个活性化合物。证明了该方法在先导化合物发现中的有效性。

 01

引言

在药物发现过程中,传统的虚拟筛选技术运用计算化学方法对大型化合物库进行筛选以预测它们与特定生物靶标的相互作用,但它也存在一些显著的缺陷和局限性,如在筛选过程中,这可能会产生高昂的成本费用且耗时较长。此外,尽管基于物理的对接方法在预测蛋白质-配体相互作用方面取得了进展,但它们仍然无法完全准确地模拟真实的生物分子相互作用,包括溶剂效应、蛋白质柔性等复杂因素,传统的虚拟筛选可能产生大量的假阳性和假阴性结果,导致筛选命中率不高,这就需要后续的实验验证来进一步筛选潜在的活性化合物,因此利用深度学习及高性能计算方法来提高虚拟筛选的效率、准确性和可扩展性是非常有必要的

 02

虚拟筛选平台(OpenVS)介绍

Autodock VinaSchrödinger Glide均可用于分子对接,它们在虚拟筛选中有各自的优势和特点。Glide使用基于知识的打分函数和遗传算法,因此该方法可能在预测最佳结合构象方面更为精确。此外,Autodock Vina作为广泛使用的免费程序之一,然而其虚拟筛选的准确性略低于Glide。目前缺乏一个开源的、可扩展的虚拟筛选平台来筛选超大型化学库,因此作者提出一种用于高效筛选数十亿化合物库的虚拟筛选方法(RosettaGenFF-VS),它将焓(ΔH)的计算与估算配体结合时的熵变化(ΔS)的方法相结合用于对不同配体进行排序。为了实现更高效的对接流程,作者设定了先前工作中的对接协议(RosettaVS)以保证受体具有更好的灵活性,使得能够在虚拟筛选中很好地模拟其柔性侧链以及有限的主链的运动。此外,还创建了一个可扩展的AI虚拟筛选平台(OpenVS)。该平台在兼顾筛选效率的前提下,用不确定性采样等多种策略以确保从超大型化合物库中筛选出最有潜力的化合物。

 03

实验结果

3.1 虚拟筛选基准测试在虚拟筛选中,基于深度学习的评分方法已经显示出大部分基准测试中的卓越性能。然而,这些方法在面对未知的化合物和受体时的泛化能力仍是一个待解之谜。因此作者使用(CASF2016)数据集对RosettaGenFF-VS与一些目前主流的物理方法做了相应的基准测试(图1d),可以发现该方法在准确区分原生绑定姿态和诱饵结构方面取得了显著的性能。此外,在筛选能力方面RosettaGenFF-VS在top1%富集因子(EF1% = 16.72)方面的表现显著优于排名第二的方法(EF1% = 11.9),表明该方法在筛选过程的早期就能识别出大量的真阳性化合物,从而提高了筛选的整体效率(图1e)。此外,该方法在在排名前1/5/10%的分子中识别出最佳结合的小分子方面均超过了所有其他方法(图1f)。作者还进一步在DUD数据集上评估了RosettaVS方法中的VSX和VSH模式在虚拟筛选中的性能,可以发现该方法在早期ROC富集方面的表现比排名第二的方法高出两倍左右,这进一步突显了RosettaVS的有效性(图1c)。

图1 虚拟筛选基准测试

3.2 筛选新型KLHDC2泛素连接酶小分子

作者以筛选与KLHDC2泛素连接酶结合的小分子化合物为例来验证该方法的筛选性能,首先用OpenVS平台RosettaVS中的VSX模式对Enamine-REAL库进行筛选,经过多次对接迭代,筛选出了预测结合亲和力更高的化合物。随后,使用RosettaVS中的VSH模式对虚拟筛选结果中排名前50,000的小分子进行重新对接,使得受体结构在对接过程中具有更高的灵活性,然后从排名前1000的化合物中过滤掉低溶解度、不满足氢键要求的化合物,最终选择了37个化合物进行化学合成,其中29个化合物成功合成,并在AlphaLISA竞争实验中表征以评估它们与diglycine肽竞争结合KLHDC2的能力,最后筛选出的化合物29 (C29)的 IC50值约为3微摩尔,表现出较优的结合性能(图2)。

图2 对接技术加速KLHDC2抑制剂发现

3.3 筛选NaV1.7 VSD4小分子拮抗剂为了进一步评估RosettaVS筛选能力的泛化性,作者对人体电压门控钠通道hNaV1.7进行虚拟筛选的研究,目标是其电压感应域IV(VSD4),该域参与NaV通道的快速失活,并包含一个小分子稳定通道失活状态的受体位点。作者使用相同的虚拟筛选方法对ZINC22库(约41亿化合物)进行了筛选。与KLHDC2筛选类似,新化合物在每次迭代中预测结合亲和力都有所提高,接着从筛选中排名前100,000的分子中再使用RosettaVS中的VSH模式重新对接以考虑受体结构的灵活性。为了确保所选化合物的化学新颖性,作者特别排除了已知含有芳基磺酰胺官能团或结构上类似于抗组胺药或β受体阻滞剂的分子。最后成功合成了9个分子,其中四个化合物的IC50值优于10 μM,命中率达到44.4%(图3)。

图3 深度学习方法加速Nav1.7粘合剂的发现

 04

结论

作者设计了一种于物理的虚拟筛选方法RosettaVS,并集成到一个可扩展的平台中。它通过主动学习策略进行大规模虚拟筛选发现了七个与新E3泛素连接酶KLHDC2结合的配体和四个与人体电压门控钠通道NaV1.7 VSD4结合的配体,可以发现RosettaVS方法较高的对接精度及采样效率使其在虚拟筛选方面具有显著优势。在未来可考虑将基于深度学习的打分函数整合到其中可以进一步提高虚拟筛选过程的准确性和效率,从而加速新药发现和药物设计的进程参考文献

Zhou G, Rusnac D V, Park H, et al. An artificial intelligence accelerated virtual screening platform for drug discovery[J]. Nature Communications, 2024, 15(1): 7761.

合肥科生景肽生物科技有限公司成立于2018年,目前已经打造了全球领先的以肽为核心的生命分子发现、合成生产、结构优化、递送平台,主要瞄准肽发现及靶向递送,专注于为各大制药企业、生物技术公司、科研单位提供一站式的定制化研发服务。 公司独有的KPDS™平台(KS-V Peptide Discovery Services Platform)是国际领先的的多肽药物发现平台,我们致力于创新药物的高效和精准开发,以科生景肽专有KPDS技术为核心,提供一站式,定制化的多肽发现服务,以灵活的产品形式和服务模式助力广大客户各类药物发现项目的快速推进和应用探究,包括但并不限于疾病诊断及保健功能产品、多肽药物、核素偶联药物(RDC)、基于小分子的肽药物偶联物(PDC)和多功能肽偶联物等。
中文官网地址:https://www.ks-vpeptide.com.cn/
英文官网地址:https://www.ks-vpeptide.com
© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片