李成涛博士:AI助力解决不可成药靶点药物研发

收藏
关键词: 靶点药物药物研发研发
资讯来源:药事纵横
发布时间: 2022-07-16
声明:因水平有限,错误不可避免,或有些信息非最及时,欢迎留言指出。本文仅作医疗健康相关药物介绍,非治疗方案推荐(若涉及);本文不构成任何投资建议。



















药鼎记——分享生物医药行业全产业链干货的优秀直播平台,我们正在寻找中国医药创新100位思想者,欢迎加入。





















蛋白质中的长链氨基酸扭曲、折叠并交织成复杂的三维结构,这些结构在从前可能很难甚至根本不可能被破译。直到DeepMind宣布,科学家们首次发现了即使在不知道相似结构的情况下,可通过计算来预测蛋白质结构的方法,人工智能(AI)将“不可能”变成了“可能”。拓展看来,AI助力创新药的开发,也可以助力解决难成药或未成药靶点的药物研发问题。这也吸引了从清华姚班出身的李成涛博士,从计算机领域踏入了创新药研发的领域。


李成涛博士,星药科技创始人兼CEO,本科毕业于清华大学姚班,在麻省理工学院获得计算机博士学位。李博士拥有多年机器学习和人工智能的研究经历,是多个创新模型的提出者,并在人工智能顶级会议和科学期刊上发表数十篇论文,是人工智能+药物研发领域的顶尖学者之一。此外,他还曾被评为西贝尔学者(Siebel Scholar),该奖项专门用于表彰在计算机科学、商业和生物工程等领域内世界顶尖研究院所中最突出的研究者,西贝尔学者也被称为是“改变世界的优秀学者”。李博士于2019年创立了星药科技,通过使用人工智能的前沿算法,结合计算化学、药物化学和生物学的经验及洞见,全方位赋能药物研发。


药鼎记:李博士从清华姚班到麻省理工都是攻读的计算机,是如何转到药物研发的呢?


李博士:最初主要是研究AI模型和理论方面的内容,然后开始应用到自然语言处理和图像生成波士顿学习期间接触到了生物化学、材料学等学科人工智能的交叉方向,发现AI可以在很这类科学领域应用,而最直接的落地领域之一就是药物研发。通过阅读文献和书籍以及与很多药企交流沟通之后,我意识到AI可能成为支持下一代药物研发的核心技术2019我回国创立了星药科技这家公司,希望用最前沿的AI技术支持药物研发中的关键环节,比如蛋白小分子结合能预测蛋白小分子复合物结构预测、分子设计/筛选/优化。在AI的帮助下,这些都可以做得更快、更准AI制药是一个交叉领域,我们公司的同事也是来自不同领域,除了计算机之外,还有生物、药学、化学等科学领域的我们希望通过多学科的交叉,用全新的方法来解决药物研发中的难题,从而开辟出新的道路。

药鼎记:刚刚提到的人工智能在蛋白质结构预测的话题,目前AI对蛋白质结构预测的精准度如何呢?


李博士:蛋白质结构预测是一个很长时间都没有被很好地解决的问题,长期以来大多数时候都依赖着实验的方法AlphaFold2018年出现就已经超越了当时所有已有模型2020AlphaFold2的横空出世使蛋白结构预测精度达到了约等于试验精度的程度,这是非常激动人心的。AlphaFold所解决的蛋白质折叠问题被称作“50-year-old grand challenge of biology”,可以说是一个“圣杯”级别的问题。而通过AI,我们高效、准确的解决方式。


药鼎记:现在做AI的公司也逐渐多起来了,技术肯定是有强有弱的,但互相的差异具体在哪里呢?


李博士:产出的结果来看,一种是别人做得到我也可以做到,但我做得更快更好,也就是人有我优比如去做高通量虚拟筛选,有很多工具都是可以做的,但是如果我们有更干净的数据有效的算法,那么们就可以比别人做得更好。还有一种就是别人干脆就做不到而我们可以做到,也就是人无我有比如做难成药靶点的药物设计AI可以想到一些没有被考虑过的化合物空间我们公司在做一个肿瘤相关靶点项目的时候就遇到这样的情况项目的目标是要设计一个在两个不同靶点上面都有活性的小分子这种情况下,靠传统方法做药物设计的话会比较受限。通过人工智能方法设计些针对两个靶点可能有活性的分子库再去做大规模虚拟筛选这其中我们需要考量两个靶点上的结合构象设计的分子特异性等,最后我们确实找到了在两个靶点上都显示相当活性的分子,完成了新技术的验证和落地


药鼎记:难成药和未成药靶点用AI是怎么去做的呢?


李博士:现在很多生物科技公司和药企都面临着靶点内卷的问题做难成药靶点的初衷希望突破内卷,做出有技术壁垒和差异化的好药。但是如果一个靶点难成药,往往会伴随着很多药物研发上的困难


比如,一个重要的方面就是难成药靶点往往相关数据很少。如果数据很多的话,一般就是靶点已经做了很多年了,而且很可能已经有药上市了。这种靶点就算是是一个比较成熟的靶点了。还有一些靶点因为比较新,所以有数据模态的缺失,比如说有些靶点它可能没有已经解析出来的结构。这种情况在AlphaFold2出来之前,我们很难低成本快速地确定它的结构,没有结构就没有办法基于它的结构去做分子理性设计。有一些是即使有了结构,但是蛋白本身是柔性的,在跟小分子结合的时候构象发生了变化,这也会影响下游我们去做小分子的理性设计的准确度。我觉得目前这些问题都可能会造成靶点难成药,所以需要我们开发更新的方法去各个击破。


如果靶点相关数据少,可以有很多不同的方法解决。可以做零样本学习或者小样本学习的这种学习模式,或者做多任务的学习。在算法和数据模态上的增强使得我们在小数据上也可以做到非常可观的泛化能力和预测能力。我们之前有过关于模型泛化能力的探索,前一阵子在JCIM上发表了。我们当时跟上海交通大学、中山大学和阿斯利康合作,设计了一套基于蛋白结构和小分子去预测蛋白小分子结合能力的新算法,涉及到一些局部的结构和全局结构的平衡,极大提升了模型泛化能力,在真实的药物研发数据上表现很好。


靶点如果没有结构,也可以在一定程度上解决。先用已有的蛋白质折叠算法去预测一个大致的结构,然后再去做分子对接。但这里面有一个问题,就是在以往的实践中,都是假设蛋白结构是刚性的;但是蛋白本身是具备柔性的,如果柔性比较强的话,用刚性蛋白去做对接就会偏差很大。我们前一阵子的工作TBind在一定程度上解决了这个问题。我们针对蛋白质小分子,将部分蛋白柔性考虑在内,用基于AI的方法预测它的复合物的结构,然后基于这个结构再去做优化,就可以有的放矢,做得更准。


有了复合物结构以及在小数据上面有效学习的模型之后,就可以用AI对分子进行有效的设计与优化了。我们搭建了一套完善的流程,通过收集不同药化专家设计/优化分子的经验来实现有效的设计。在特定情况下,哪些基团可以换成另外一些基团,或者一些常见的改构比如开环、闭环或者加/减基团的情况,这些都可以通过我们不断积累数据,抽象出规则,然后把这些规则交到AI模型手中,让它学习设计/优化的经验,进一步产生有针对性的分子。这些设计出的分子是符合药化专家做药物研发的逻辑的,同时在一定程度上还可以跳出他原本的舒适圈,从而帮他去触及更广阔的化学空间。


通过这套流程把各个模块串联起来,使得AI可以更自动化、智能化地去解决很多不可成药靶点的分子发现工作,而在这个过程中通过不断迭代,优化出更好的模型,设计更好的分子,再用更好的筛选模型去筛选,最终攻克不可成药靶点的药物研发问题。

总结

无论是通过计算机搭建模型,还是通过专家研发模式,在医药研发创新的领域里,通过专家和AI的结合都能相得益彰。一方面可以借助AI强大的计算方式拓展人力的局限,一方面通过专家的经验再来筛选出有利的结果,两相结合,哪怕是难成药或未成药、蛋白质结构预测等难题,都有望在将来能够有所突破。创新药的研发本质上是多学科的结合,AI的助力将使其走得更远、更深。


“药鼎记”主要分享生物医药行业全产业链干货包含仿制药、新药BD投资、CXO、改良制剂、抗体、细胞基因治疗等干货,促进上下游建立信任合作。两年内精准服务300+生物医药领域大的企业+创业者建立IP。


参考资料:

药鼎记视频号