▎药明康德/报道
在近期举办的2021药明康德全球论坛上,40多名行业顶尖意见领袖跨越时空,分享经验教训以及对未来创新机遇的独到见解。为期3天的精彩讨论吸引了全球超过6000名生物医药行业同道线上参会。
为了便于更多新老朋友领略、重温专家洞见,药明康德内容团队持续推出论坛所有10场讨论的文字实录。第8篇的讨论主题为“定义下一个20年”。更多报道请关注“药明康德”公众号。
近10年间,机器学习快速发展,基于海量数据的迭代学习,AlphaFold已经可以精准预测蛋白质的3D结构。未来20年,当医疗创新与技术突破相融合,将如何重塑药物研发领域,助力提高新药研发的成功率?我们是否能建立疾病路线图,厘清包括基因组、表达谱、组织病理学信息等多因素对疾病的影响,最终预测疾病的发展?我们如何实现分享信息的平衡?
2021药明康德全球论坛的第三天“定义下一个20年”环节,在Polaris Partners管理合伙人Amir Nashat先生主持下,Verily和Google Health临床政策和战略负责人Robert Califf博士和基因泰克研究和早期开发负责人Aviv Regev博士,从不同角度分享了他们的深刻洞见。

更好预测生物医学和新药研发的结果
Amir Nashat先生:非常高兴能和Aviv Regev博士和Robert Califf博士一起讨论我们行业的未来。我们需要讨论的是,此后20年间,新药发现将会是什么样子,以及20年后,我们可能取得的所有进展。首先,我们会从行业现状出发,并在一个更顶层的视角来谈谈未来20年。Aviv Regev博士,我相信你会有一些好的想法,你正带领基因泰克(Genentech)朝这个方向发展。很高兴能聆听你对未来20年的看法。
Aviv Regev博士:非常感谢。很高兴能和你们两位一起讨论。对未来20年的思考是一个大的挑战,但我认为我们面临的更大的挑战是,让生物医学和新药研发变得更加可预测。这样我们可以得到更好的预测结果,有更好的能力得到我们想要得到的,也让这些结果变得更有可解释性。我详细解释这三点,因为这是我们建模的三个原则。
首先,我们应该知道我们目前还没有能力做什么。实际上,我们还无法预测我们在生物医学领域所做的大部分工作的结果。从基础生物学到新药研发都是这样。事实上,我们通常要在实验室做实验,或者在患者身上做临床试验,看看会发生什么。由于我们的预测能力不是很强,我们为此付出了很大的代价,很多时候我们都失败了,没有得到我们想要的结果。我们也可能完全忽略了我们原本可以作为药物靶点的东西,因为我们没有意识到它会得到一个有益的结果。
以前我们认为生物学难以实现可预测性,因为生物学有很多非线性问题。不是简单的1+1=2。也就是说,用单独的药物做单独的研究或临床试验,并不能真正告诉我们联合用药后会发生什么。还有其他类似的问题,但我们今天知道,如果我们有足够的数据,我们实际上可以解决这些非线性问题。这得益于机器学习的发展,而这些进展发生在不到十年的时间里。在其他领域,一旦有了足够的数据、进行足够的计算和有正确的算法,你就可以做出很好的预测,并以我们以前做不到的方式了解许多情况。
我认为和生物医药领域相关的最新最酷的例子是AlphaFold2的进展,它着眼于单个蛋白质结构,如果用足够多的数据训练它,就可以预测下一个蛋白质的结构。总的来说,(机器学习)都需要有足够的数据,足够的计算能力和正确的算法。不同的是,(机器学习)将如何重塑新药研发领域?我认为我们需要意识到的第一件事是,在预测生物医学方面,算法能给我们三种信息。
首先是预测。举个例子,我们想要获得某个靶向特定蛋白的抗体。关键问题在于,如果我给你一个抗体和一个蛋白质,需要预测这个抗体能否很好地结合蛋白质。下一个问题是我们所说的生成模型。如果我给你一个蛋白质,你是否可以给我一个能与之结合的抗体序列,哪怕之前我们从来没有这个抗体的信息?最后一层,我们称之为可解释性,也就是需要解释,“为什么这个抗体结合了蛋白?或是为什么没有?”
这里或那里的蛋白质残基,结构原因等等。在一个理想的世界里,这三样能力我们都要有,我们可以用这些方法来解决任何问题。问题是,就目前的新药研发来说,这个理想化的世界如何与现实相印证?我要说的是,机器学习的进步让我们有了更好的算法,与此同时,生物学也有了进步,我们大规模生成数据的能力也发生了巨大的变化,当我们考虑实验室实验和人体试验时,它们本身就是一种计算形式。细胞生物学和遗传学的一个美妙之处在于,我们可以直接对细胞进行实验。我们可以通过基因干预,观察会发生什么。
事实上,机器算法和我们实际的生物细胞实验形成了良性循环,由此,我们可以开发出可预测靶点结合、可生成抗体序列或可解释成败原因的模型。然后我们不仅可以测试这些模型,还可以根据算法生成下一轮的数据,做出更好的预测。
最后,正如开场时问道,我们首先会在哪里看到影响?我认为,还是要回到临床层面,一直到非常早期,还在定义要研究什么靶点的阶段。我们已经看到了新药研发在某些领域受到影响。而且,它们通常处于开发的后期阶段。当我们往更早期的阶段走,受影响的不仅是化学筛选,抗体筛选和细胞治疗,这些都还是做出正确干预的生成模型,但我们更要问自己,我们想要的治疗靶点是什么?这实际上是目前我们做得最少的地方,也可能是影响最大的地方。
这将是最难解决的问题,因为可能性的空间是最大的,但如果我们解决了它,我们将得到最大的回报。也许我先到此为止。我很好奇Robert对这些事情的看法。
Amir Nashat先生:是的,那很有趣。Robert,预测也许是通往未来的道路,我们对于天气和其他许多事情的预测能力,影响是深远的。你的整个职业生涯都在思考临床数据、临床经验和患者体验,你认为我们已经有能力来收集数据帮助预测新药研发了吗?还是说你觉得我们还有很多工作要做?
Robert Califf博士:我们还有很多工作要做。我的第一个学术项目是试图和一个团队一起对一种血管疾病的临床结果做出预测。我们的第一笔科研经费用于仿照气象局的工作建立模型,因为气象局的成败取决于它预测的准确性。我想我们学到了很多。这最后成了一个概率练习。我们的预测永远不会完全确定。我们一直在努力提高概率,以减少不确定性。想一想在某个“可能”下雨的时候出门,你一定知道我的意思。
我还要补充一点,Aviv先前提出的观点,我认为这是“盲人摸象”。我职业生涯的大部分时间都花在临床试验上,这些试验源自一些人的最佳想法,他们的想法已经通过了所有基础研究、动物模型的验证,说服了投资者,通过了机构审查委员会(Institutional Review Board,IRB)和FDA的批准。但即使已经进入了人体临床试验阶段,其中90%以上还是以失败告终。其中大多数是因为,要么没有预测到脱靶效应(off-target effect),要么虽然靶点产生作用,但它的整体生物学影响与预期不符。任何能将失败比例从90%降低到80%或70%的因素,都将对临床医学产生巨大影响。但我最后也要补充一点,我们谈论的不仅仅是新药研发本身。
正如Aviv所说,我们不再受计算的限制。我刚刚谈到盲人和大象的寓言,我想说的是,我们现在不仅可以计算整个大象,但更重要的是,我们可以计算象群了,它们是如何相互作用的,它们是如何与环境相互作用的。即使有一种对部分生物学有效的药物,也不能就此知道它在现实生活中,在不同的人群和不同的环境中,会有什么样的综合益处和风险。这正是Aviv正在努力改变的,但我要说回到一个事实,如果我们能够提高概率,即使是一个非常微小的程度,对现有的疗法以及这些疗法对人类产生的实际效益都会产生巨大的影响。
Aviv Regev博士:如果让我接着Robert说下去的话,我认为你提到了非常关键的一点,它在过去十年由于技术推动而取得的巨大进步——我把它称为“人类生物学”。历史上,很多药物的研发都必须从一个模型开始,而直接接触到人体,会在非常晚的阶段。但如今,我们越来越发现,我们实际上开始就可以从“人”开始,在整个过程中我们也可以一直将“人”包含进来。即使我们转向模型,我们还是一次又一次地回到人体研究。其中很大一部分是因为我们有了更好的测量技术,从单细胞分析到可穿戴设备,到丰富的医疗记录。
这也让我们看到更多层面的东西,而不是对一些正在进行的(试验)抱有理想化的看法。不过就是你将所有可能都计算在内,还是有另外一些广泛的可能性。比如说,作为一个人类遗传学家那样,你想说,“好吧,我要让下一个来的病人,对他的基因组进行测序,看看所有的基因变异,了解它们对许多不同疾病的风险,以及对多种不同疗法的反应。”
地球上只有70亿人口,但是让15万个基因变异两两组合配对,得到的组合数目就达到了240亿种,而且我们知道,15万比人类基因组中的变异数目要少得多。我们仍然可以从中获得一些有用信息。我认为,它仍然可以预测的原因是,并不是每个人都那么特殊,我们还是有很多可重复性,有很多重复的模式,而新药研发实际上是可以从中受益的,特别是现在我们可以比以前更明确地使用这些信息。这意味着我们需要掌握正确的数据,我们必须比以前,在更大的范围内,了解更多具有更丰富表型的人类。距离拥有一切(信息)我们还有巨大的差距,但这不是重点,我们不需要所有的信息,只需要能够回答问题的足够数据。
我也非常同意Robert所说的,我们需要减少不确定性,我们不必百分之百正确。我们已经给(药物开发)过程带来了巨大的好处,也最终给患者带来了巨大的益处。

绘制人体疾病地图,为治疗“导航”
Amir Nashat先生:也许这个问题我可以同时问你们两位。出于各种各样的原因,有很多数据正在产生。回顾20年前,诊断往往只测试单个数据点,比方说C反应蛋白(CRP)水平。现在,人们越来越想同时测量更多东西。比方说,担心我心脏有问题,就不仅测量我的心脏指标,还用遗传学的方法测量了整个身体情况。我在想,关于疾病,甚至(治疗)目标的定义是不是会发生巨大的变化。比方说,癌症方面,如今肝癌的定义发生了改变,在进行肝癌诊断时更加分子化。这种变化是否会扩展到所有的其它疾病,它们的定义是否都将被改写?我们目前在寻找的目标是什么?目标是健康人吗?是我的血指标吗?什么是正常?什么是异常?你们启发我想到了个很有趣的问题。怎么看待疾病的定义?这是我的问题。
Robert Califf博士:我们资助了一个项目,名为“心血管疾病的一个勇敢想法”(One Brave Idea in cardiovascular disease)。其结果就是对疾病表型的思维过程,或者说是表型数据集合(phenotype stack)。哈佛大学著名教授,布莱根妇女医院(Bringham and Women's hospital)的Calum MacRae博士一直在领导这个项目。我认为最疯狂的事情之一是,计算现在如此广泛运用,有这么多的容量,实际上可以考虑所有不同的可能性。作为人类,我认为很明显我们最终想要的是能保持健康,或预防疾病,或拥有最长的健康预期寿命,这是一个非常抽象的概念,但从完整的人类到器官系统,到细胞的每一个层次,我们都可以研究。
我认为我们需要寻找的变量是,可操作的特征组合,如果我们进行干预,它会对人体产生有益的影响,最终实现人体全面健康、功能完整的目标,然后促成一个健康的、功能齐全的社会。当然,问题是越是深入到基本层面,就越有可能需要通过Aviv提到的系统生物学来预测对整个人体的影响。作为一个来自南卡罗来纳州的心脏病医生,我问过MacRae博士,“我们需要多少表型才能取得真正的进展?”
他说,“如果是单细胞生物,我们已经拥有了表型的百科全书。如果是人类,你需要有大约108个表型,才能实现这个目标。”
我说,“好吧,这对我来说意味着好几辈子。”
感到安慰的是,(我们)可以把不确定性降低,做一件更有可能产生好结果的事情。
Aviv Regev博士:关于108个表型,我想再稍微多聊一聊。
从历史上看,当我们思考这些事情时,我们的工作还在很基本的层面。也就是说,如果有2万个基因,就有2万个维度。我们必须对所有这些都进行明确,而我们从生物学和其他领域中所学到的是,因为不想被一些先入为主的观念限制,所以我们才需要如此广泛的表型。我们想得到丰富的表型空间,然后我们再缩小范围,直到找到这些维度中真正要素中的真正维度。这些缩减不一定是线性的。我们现在知道它们可以是非线性的。在我们所说的隐空间里,我们不能直接看到这些空间,但我们可以通过计算推断出,惊人的事情将会发生,例如,我们可以在那里进行预测。你有了第一种干预和第二种干预的结果。在这些特征衍生的隐空间里,你可以试着说,“如果我同时进行两种干预,会发生什么?”
这也适用于细胞中的基因干扰和人体药物治疗等。在这一层面上,表面上可能有108个特征,但实际重要的可能比它小几个数量级,他们存在各种非线性变换。我们现在对它们不了解。这就是为什么我们经常分类错误的原因。我们有时分类太宽泛、或过于狭窄或有交叉的类别,等等。这会把我们做的很多事情搞砸。例如,当我们不能根据疾病对患者进行正确分类时,我们可能会因为没有对患者做出正确的细分导致临床试验失败。结果,我们扼杀了我们正在寻找的信号。也可能,药物是对的,也发挥了正确的作用,但问题是“在错误的患者身上给药”,或者说,给患者用了错误的药物。
第二,在医学生物学上,有被称为卷积运动的东西。当你有一个卷积神经网络,你基本上在这些层之间有很多不同的转换。现在通过类比和许多不同的方式可以获取信息,并相互关联。你可以获得基因组、表达谱、组织病理学信息,也可以从核磁共振成像中提取某人的信息,然后你可以思考你是否真的理解它们的功能关联。这种功能存在于我们的身体中,因为归根结底,我们是一个基因的集合体。在不同的细胞内有基因组的拷贝,这些细胞包含的分子形成了组织器官和生理学特征。而人口总量也很大,但我们并不知道所有的基因信息。
如今,当我们想知道三种不同类型的信息时,实际上我们需要测量三次。我们需要给基因组测序。我们必须做组织切片,用各种抗体染色,我们也要做核磁共振成像。但也许我们可以知道他们的因果关系,这是可预测的和生成的。这样,将来我们就不需要测量所有这些东西。我们只需要测量其中一些信息,接着就可以从算法中得到结果。另外,我们会了解它们之间的关系,这是我们真正需要的,由此可以预测药物是如何起作用。
我要说的第三点是,如果所有这些都得到了满足,Robert真正想要的其实是疾病路线图,这也是Amir先前指出的。一个病人来看病,会进行一系列的检查,以获得他贯穿一生的医疗信息和其他信息。你希望可以告诉患者,“在这种疾病中,一些基因型特征可能产生干扰,另一些环境特征可能起作用,这些细胞可能起到重要作用,这些细胞中的基因表达可能有影响。”
在这名患者中,是这些细胞、器官、在特定位置的组织会对药物产生应答,药物可能包含基因疗法、细胞疗法、小分子疗法或者大分子疗法,或者是我们从未想过的新的方式。仅靠药物可能本身不会实现某个目标。这是能够预测疾病不同影响要素的美好未来。
Aviv Regev博士:108个变量,这就是我们需要做减法的。
Amir Nashat先生:是的。

Robert Califf博士:我有幸在谷歌(Google)工作,我们每天都会用到简单明了的谷歌地图。如果我15年前告诉别人,“你坐进车里,开始和它交谈,它就会告诉你该去哪里……”
因为每一条路都在地图上有显示。然后,实时发生的交互将通过人工智能和机器学习来帮助做出决策,并形成语音和你交谈,给你提供选择。(15年前)你可能会想,“这太疯狂了。没有人会那样做的。”但如今我们认为这是理所当然的。现在,人类的疾病要复杂得多,在FDA有一句话,“我们只相信上帝,其他人都必须通过数据来证明自己。”
对于像Aviv这样的人来说,这是一个非常大的课题,我在精神上非常支持她的理论。将来,可以将预测结果作为实际答案,而现在预测结果更多还是一种理论,还需要再在完整的人类群体中结合实际经验进行论证。
Aviv Regev博士:说回刚才的问题。我有幸成为建立人体地图计划的共同创始人之一。我们经常称之为谷歌人体地图,我认为这个类比非常贴切。但就我们实际绘制人体地图而言,仍然是数据驱动的。我们有信息本身。正如谷歌街景车(Google Street View Car)可以到处拍摄照片来提供地图信息。因为世界实际上是在相对缓慢的时间尺度上变化的,所以我们给房子拍张照片,可以用于一段较长时间的导航。但我们的身体行为与此大不相同,那里有一系列更大的挑战。
回到我之前说的,我们有一个比谷歌地图更难解决的问题。我想我们都同意这一点,但我们也有一个很大的优势。事实上,世界上没有什么东西能阻止我们做实验。当然我们必须适当地去做,必须有效率。如果是实验室实验,它们必须符合临床试验的伦理规范。我认为试验这种方式不会很快消失。我们只想用它们获得更多,我们想改变它们,让它们给我们提供比以前更多的东西。因为它们可以和计算和数学的方法相结合。将这两种方式结合,这才是前进的方向。
这可以给我们提供巨大的优势,在生物学中,我们可以干预病因。我们有遗传学,可以是自然通过进化所赋予的人类遗传学,或者是我们自己干预的实验室遗传学。在新的计算方法被运用到的其他应用领域时,很少有像在生物学这样,你可以真正做到以上这些。当你试图了解一个人是否喜欢你的广告时,你实际上无法进入他们的大脑并干预神经元,但当我们想了解细胞是否会对化学生物学中的小分子干预做出反应时,我们可以做到追查分子作用。我们可以以惊人的规模做到这一点。我们可以用人类来做这项实验,因为人类遗传学被应用于这项实验。我们只需要将表型与人类遗传信息联系起来。
这对我们来说是一个非凡的优势。但从计算手段方面来说,这相对不发达,因为生物学领域的遗传信息远比其他领域复杂。我们需要设计我们的数据收集,我们的实验室实验,我们的临床试验,我们所做的每一件事,是为了真正将我们的最大优势发挥作用。但即便这样做,我们仍然无法测试所有的可能性。这是涉及到我们如何接受预测结果,我们应该不断迭代。我们应该收集我们的数据,尽我们最大的能力建模,做出预测并测试它们。我们不必在预测之后停止。我们只需大大缩小搜索范围,或许可以探索那些我们原本在地图无法找到的领域,这样我们就可以做下一组实验了。
这样做的话,我们实际上可能会得出某种可预测的结论,让FDA也可以相信它……我们不需要百分百的完全相信这些结论。这不是不容置疑的晓谕。它只需要降低不确定性的程度。这就是Robert告诉我们要做的。

行业数据共享的重要性
Amir Nashat先生:是的。我觉得这很有道理。如果我看一个临床试验,比如说,一个生物技术企业家或年轻科学家,任何人都在试图做出预测。他们认为他们的药物应用于那个靶点会有积极的结果。
然后我们得到了数据,但当我们对比你谈论的数据和你实际掌握的数据,就会发现其实有很多数据没有公开发布。我们最后听到的是,试验成功还是失败。我们并没有得到所有的结果。我们并没有得到你所需要的所有数据,这些数据可以让你对这个靶点进行全面的模拟。
我们得到数据了吗?我的问题是,在行业层面上,现有的运作方式是否允许我们共享足够的信息或者相互提供足够的信息,从而能够使这些模型发挥作用,因为我们所说的是非常复杂的建模练习,这是运用到人体上的,并且当试验失败时,基本上目前公布的数据质量还非常差。药物没有起作用。但为什么没用?是因为你的药不好,还是剂量问题?我想,是否由FDA或者行业来带领分享这些信息更好?我们如何实现这一点呢?我认为这是一个美好的愿景。
Robert Califf博士:我们有一些例子可以分享,其中一个我曾参与其中,还有一个现在正在进行。我们曾经有过这样一段时间,公司的临床试验实际上没有完全公开所有信息,因为从业务角度考虑,他们认为这些是保密信息。我们中的很多人一起提出建议,“如果你做人体试验,你需要志愿者的知情同意,让他们了解试验将得出一些通用的知识。否则是不合适的。”
我们现在有了临床试验的登记网站(ClinicalTrials.gov)。法规要求,你必须登记你正在做的试验,并且你必须出示结果。目前还没有详细到像刚才Amir说的那种程度。第二个例子是,如果你去看新冠疫苗研究,这是所有机构分享信息的伟大案例。我知道我们的时间很短,所以我只能说,我们必须找到一个恰当的平衡点来保护知识产权,创造刺激机制,让整个行业能够持续发展,同时找出如何分享足够信息的方法,推动行业向前发展。我花了25年都没有做成的一件事情,就是研究那些没有取得成功的药物分子。根据法律,这些信息是受保护的。公众无法获得。但是我们需要有一种方式来分享它,因为这些信息可以避免很多错误的努力,这些努力是可以预见的,因为别人已经失败了。只是人们不知道。
Aviv Regev博士:首先,我认为Robert谈到了过去几个月里我们在生活中发生的事情,到目前为止我们受到COVID-19影响已经将近1年时间。我认为,它确实改变了人们对数据驱动的药物发现的看法。这是必然的。2020年1月,你还无法在PubMed上找到关于新冠的信息,因为那时它刚刚出现。而由于COVID-19大流行的紧急需要,现在人们已经对很多研发流程进行了创新尝试。我认为我们非常有希望,看到一些正在发生的改变,这对于人类福祉的提升特别重要,而这也将有助于我们理解成功分享(数据)的途径,正如Robert所强调的。
我还认为,即使在组织内部,也有很多数据不被共享,这都是基于这些年来收集和保存数据的方式。即使在没有法律障碍的情况下,即使在我以前所处的学术界,也是这样。通常,即便是一些公共数据,人们也可能无法真正轻松地共享数据,这是因为数据本身就没有以可共享的方式进行处理。算法可以帮助解决这个问题,人类的契约也可以。
一方面,人们要愿意分享并为此付出努力,但同时,算法可以帮助处理以前那些不那么有序的数据,以此从中获得收益。我要补充的是,这是我们的另一个机会。我要强调的是,Robert和Amir都提出了这一点。我们既需要成功案例,也需要同样多的失败案例。另外,要知道,提升预测性能,最好是采用完全不同的训练集和测试集。而这可能最终成为不同组织之间数据共享的最大动力。
Amir Nashat先生:谢谢两位,为我们描绘了一个非常有吸引力的未来,一个能够预测新药研发和产生大量数据共享的未来,所有这些都有一个共同的追求,那就是让人类的旅程变得更美好。感谢两位,也感谢你们一直在做的工作,每天都在帮助这么多病人改善生活。
Robert Califf博士:这场对话很棒。我都想再为此奋斗50年。
版权说明:本文来自药明康德内容团队,欢迎个人转发至朋友圈,谢绝媒体或机构未经授权以任何形式转载至其他平台。转载授权请在「药明康德」微信公众号回复“转载”,获取转载须知。
