Chemical Space Docking | 下一代虚拟筛选技术

前段时间,Nature 报道了一篇 Enamine 与南加州大学合作通过 V-SYNTHES 方法实现了高达110 亿级化合物筛选的文章[1],吸引了很多人的关注。有很多企业前来咨询,下面就简要地介绍一下化学空间对接(Chemical Space Docking)的基本概念[2]。

传统基于结构的虚拟筛选会遍历化合物库中的所有分子,当化合物库较少时,自然是没有问题。但是,随着化合物库越来越大,发展到了化学空间(即超大规模化合物库),如 BioSolveIT 和 Enamine 联合打造的 Real Space 目前就达到了 230 亿的级别[3],那现有的计算资源就彻底无法满足需求了。

为了适应化学空间的发展,化学空间对接应运而生。要理解这个概念,我们先回到九十年代初期,那是一个知识迸发的时代,前后诞生了多种对接算法,其中就有一种基于片段生长的对接算法 - FlexX。
FlexX 的基本原理是将化合物切割成不同的片段,将不同的片段放置在结合口袋中,最后将片段连接起来形成完整的分子。后来,FlexX 也成为高通量虚拟筛选的首要选择。
可随着化合物库的逐渐增大,从早期辉瑞的10的12次方到目前葛兰素史克的10的26次方,基于 FlexX 的筛选方法已经无法满足。因为归根到底 FlexX 会将每一个化合物切割成片段,然后在口袋进行片段生长构建完整的化合物,最后遍历化合物库的每一个分子。
但是,当化合物库进化成化学空间时,一切就不同了。因为基于组合化学方式构建的化合空间,都是由一些基本的构建块通过化学规则连接而成。高达两百多亿的化合空间,其实际的构建块可能就仅仅只有十万多个(如 Real Space)。
我们可以简单的将化学空间对接中的构建块理解成 FlexX 中的片段,这些构建块被放置在结合口袋中,将不同的构建块连接起来,就可以形成完整的化合物(与FlexX类似)。所以,通过构建块的对接和组合,实际上就实现了百亿级化合空间的虚拟筛选。
当化合物库进化到化学空间后,化学空间对接其实是 FlexX 发展的必然方向。试想一下其他的对接算法以后的进步空间。。。。

下面具体地介绍一下化学空间对接:

Chemical Space Docking
与已知的虚拟筛选方法类似,化学空间对接也是在对接后通过结合模式预测活性分子。然而,对接的分子不再来源于一个枚举库,而是一个由无数分子形成的组合空间。
在初始步骤中,所有构建块都被用于对接。而后,构建块基于真实的化学反应进一步生长。所以就可以在不对接化学空间每一个化合物的情况下,找到潜在的活性化合物,同时节省了大量的计算资源。
Initial Step - Building Block Docking
将用于构建化学空间的构建块进行对接,而不是化学空间的所有化合物,这一步非常重要!!!后通过 HYDE 等去溶剂化感知评分函数评估结合模式,自动过滤不能进一步生长的(红色)、没有发生相互作用(橘红色)、打分低(绿色)的构建块。基于模板的对接和药效团约束也可用于对接构象的微调。最后,可能形成具有良好类药性化合物的构建块进入下一步。

02  组合化合物生成

在化学空间对接中,基于化学反应,初始构建块和其他构建块进一步结合形成新的片段,评估其的结合模式,排除可能使最终化合物性能不良的片段,在这里,基于片段的药物发现方法(片段生长)起着关键作用。 这种多步骤的过滤方式从而允许以极少的计算工作量就可以探索整个化学空间。
片段生长步骤可以根据需要重复多次,因此每次运行都会以组合方式扩展化学空间。 想象一下:1,000 个构建块(A 组)和 1,000 个构建块(B 组)的一次组合就可以探索10的6次的化学空间。 将这些分子与另一组 C 的 1,000 个构建块的组合,就可以扩展到10的9次。。。

03  可访问的结果

对生成的化合物重新对接,评估结合模式,并过滤掉性能不佳的化合物后,化学空间对接最终呈现一组可能与靶标结合的化合物。 由于是应用化学反应规则来创建化学空间,因此热门候选化合物具有很高的可合成性

同时,BiosolveIT 和世界上著名的化合物制造商合作打造了系列商业化学空间,如 Eniname 的 Real Space(227亿)和药明康德的 GalaXi(21亿)等,用户可直接搜索定制的化合物。 Eniname 保证 4-6 周内交货,且合成成功率在 80 %以上,合成不出的化合物不收费等。

目前,百亿级化合空间的相似性检索可以在infiniSee中完成。百亿级化学空间的虚拟筛选暂时只提供服务,还没有集成在我们的工业化药物设计 SeeSAR 中,但是我们正在努力实现。不久的未来,虚拟筛选会迎来一场革命风暴,药物研发的进度也会极大的推进。
  参考资料  

[1]. https://www.nature.com/articles/s41586-021-04220-9

[2]. https://www.biosolveit.de/chemical-space-docking/

[3]. https://enamine.net/compound-collections/real-compounds/real-space-navigator