以疫苗为例,回顾加速纯化工艺开发的最新策略进展:DoE 和建模

收藏
关键词: 疫苗进展新策略
资讯来源:生物制品圈
发布时间: 2022-12-23

疫苗的安全性要求非常高,因为它们是用于健康人的。因此,疫苗开发既耗时又非常昂贵。缩短上市时间对于制药公司来说是关键,可以挽救生命,并节省金钱。因此,需要系统的、通用的和有效的工艺开发策略来缩短开发时间并增强对工艺的理解。高通量技术极大地增加了与工艺相关的有用数据量,结合统计和机械建模,新的高通量工艺开发(HTPD) 方法不断发展。引入基于模型的 HTPD 可以更快、更广泛地筛选条件,并进一步增加知识。基于模型的 HTPD 对于层析法尤其重要,而后者是获得高纯度的关键分离技术。


本综述将介绍生物制药行业中使用的下游工艺开发策略和工具,重点关注疫苗纯化工艺。随后将根据实验工作和理解,对高通量工艺开发和其它组合方法进行讨论和比较。在不断增长的信息海洋中,新型建模工具和人工智能(AI) 对于发现数据背后的模式并因此获得更深入的工艺理解变得越来越重要。


下游工艺开发方法



工艺开发的总体目标是设计最佳的纯化工艺,通过以最小的成本和时间,努力实现纯度目标,同时遵守所有法规要求。目前,疫苗开发主要采用基于DoE 的方法,但它也可以受益于更先进的、基于模型的工艺开发方法,这些方法已经用于其它生物制药领域,例如mAb 的纯化。图 3 显示了两种类型的工艺开发方法,基于 DoE 的方法和基于建模的方法。在下文中,将简要介绍工艺开发方法。


图3. 两种不同工艺开发方法概述。左:实验设计(DoE)方法,基于统计工具进行实验,并通过统计分析评估结果。这种方法通常应用于生物制药行业。右:基于模型的工艺开发方法,通过有针对性的实验确定模型输入参数,如等温线参数和柱参数。在执行优化之前,必须对模型进行验证。


实验驱动的下游工艺开发


一次一个因素(OFAT)和实验设计(DOE)



一次一个因素 (OFAT) 是一种更传统的方法,其中一个因素在一系列实验期间发生变化,而其它因素保持不变。在这种方法中,因素之间的依赖关系被忽略了,因此发现最优值相当困难且效率很低。出于这个原因,十多年前,生物制药行业转向基于统计的DoE 方法来设计和分析实验,从而通过减少实验获得更多有价值的信息。经典的DoE 方法是因子设计。对所有可能的因素组合进行实验,目的是确定每个因素的影响以及因素之间的相互作用对响应的影响。对经典DoE 筛选的改进是确定性筛选设计,它估计曲率效应并能够将对响应具有显著影响的因素与具有可忽略不计影响的因素区分开来。提供三级多因素设计的其它方法是Box-Behnken 或中心复合设计。Hibbert D.B.深入介绍了最常用的 DoE 方法,重点是层析。现在有各种DoE 软件,如 Design-Expert、Modde 和JMP,但其它统计软件,如 R、SPSS 和各种Python 软件包,也可用于 DoE 目的。


针对建模目的的数据获取


另一种实验策略是确定作为机械或物理模型输入的参数。机械模型的使用已在几十年前建立,如今已被化学工业广泛采用,其中一些工艺甚至完全在计算机上设计。直到最近,生物制药和疫苗行业才在其工艺开发中启动了这一策略,其中主要挑战通常是复杂的进样混合物,其中包含目的产品(例如抗原)以及数千种蛋白质和杂质。这可能就是为什么机械建模和参数采集尚未被广泛采用的原因,因为几乎不可能通过实验确定和模拟数千种蛋白质和杂质。然而,HTE使确定模型参数非常值得,即使对于更复杂的混合物。值得注意的是,经过验证的模型增加了对工艺的理解,并能够优化计算机中的工艺,从而节省时间、材料和成本。对于层析目的,由于这是蛋白质亚单位疫苗中的主要纯化技术,描述组分与固相结合行为的吸附等温线参数至关重要。吸附平衡的实验测定是建立等温线参数所必需的,可以通过批量吸附实验、正面分析、等度洗脱或线性梯度洗脱或利用逆技术获取,通过调整某些参数来最小化实验和模拟洗脱曲线之间的差异。除了等温线测定外,还必须获得层析柱和填料的特性才能获得经过验证的模型,但是这些更容易获得。


高通量筛选


大约二十年前,液体处理站 (LHS) 的引入加速了实验的执行,也称为高通量实验(THE) 或高通量筛选(HTS)。由于自动化、微型化和并行化,创建大型数据集变得可行,同时允许更短的时间内使用更少的样本量和资源。自动化的另一个好处是降低了可变性,并提供卓越的精度。如今,LHS已成为学术界和工业界广泛应用的技术,可显著缩短工艺开发时间。由于LHS 允许筛选更多条件,因此为纯化工艺找到最佳条件更为可行。除了系统的好处之外,文献也报道了一些缺点。例如,LHS在准确模拟工艺柱的液流分布方面存在局限性。HTS 需要对有效的实验设计有高度的理解,以便最佳地利用系统,因此它更像是一种工具,而不是一种单独的方法。


专业知识驱动的下游工艺开发


一般经验



经验法则、现有工艺的可用知识和经验是设计新生产工艺的专业知识或启发式方法的基础。专业见解很容易应用,并且可以通过消除结果不太理想的单元操作的组合来加速工艺设计。Asenjo等人开发了一个专注于下游蛋白质工艺的专业系统;该软件使用由通用工艺设计(启发式)专业知识组成的数据库来支持和加速选择一系列单元操作的决策。一些手册也广泛地概述了一般设计启发式。大多数疫苗纯化工艺也基于启发式方法,例如从哺乳动物细胞培养中纯化甲型肝炎病毒,其中第一步涉及低成本阴离子交换层析法,以捕获产物并去除大量杂质,下游工艺的最后步骤是使用尺寸排阻层析法的精纯和脱盐步骤。一个几乎完全基于知识的一般示例是平台工艺,将在下一段中更详细地解释。


平台工艺


平台工艺可用作“模板”,利用预先建立的一系列单元操作,针对特定类型的分子设计整个纯化序列。平台说明提供了每个单元操作的操作条件的详细信息,对应于整个纯化流程。关键优势之一是减少了类似分子的工艺开发时间、相关监管和资源要求,从而降低了上市时间和验证工作。此外,平台文件不仅可以在不同部门之间共享和匹配,还可以在不同的生产站点之间共享和匹配,成为一个无关站点的工艺。平台工艺方法最适合具有相似特征、继而相似纯化步骤的生物制药。例如,mAb的定义相对明确,平台工艺可用于为新的mAb 异构体建立类似的纯化流程。有关工艺相关污染物的详细信息,例如HCP 和相应细胞培养的其它杂质,即 CHO 和杂交瘤细胞,是已知的。纯化步骤的顺序包括Protein A 层析、低 pH 病毒灭活、IEX层析精纯步骤、除病毒过滤以及超滤/洗滤。只需对纯化工艺条件进行微小更改即可确定新的 mAb 异构体的纯化工艺。平台方法的其它潜在适用候选产品可能是 pDNA 疫苗和流感疫苗,其均具有相似的特性和纯化步骤。然而,mAb的性质相对相似,而蛋白质亚单位疫苗的表观差异很大,使得纯化工艺更加难以标准化。


基于模型的下游工艺开发


在工艺工程中,模型发挥着重要作用,它们旨在以抽象的数学形式表示一个真实的系统。Bézivin和 Gerbé 将模型定义为“以预期目标构建的系统的简化。该模型应该能够代替实际系统回答问题”。与工艺工程相关的预期目标可以是控制、模拟、设计、监控或优化。根据目标,可能有不同的模型适用。模型有助于理解复杂的问题,并且如果模型能够充分表示建模系统的目标特征,则可以提供潜在的解决方案。使用给定的一组参数运行模型即为模拟,是一种运行虚拟实验的廉价且安全的方法。因此,可以减少和/或更有效地设计实验室中的实验次数,从而减少时间和材料消耗。尽管使用模型听起来很有吸引力且很有前景,但开发能够实现预期目的的合理模型需要时间、精力和知识。此外,该领域缺乏能够开发、维护科学和工程软件的人员。在不久的将来,预计会有更多的工艺工程师或科学家会熟悉建模,因为现在大多数技术相关研究都提供编程和数据处理课程。为了建立一个模型,两个主要资源是必不可少的,即工艺知识,转化为自然规律,以及从真实系统中获得的数据的收集。在工艺工程中,可以区分第一原理、机械或知识驱动模型和数据驱动或经验模型,分别称为透明白盒模型和不太透明的黑盒模型。两者的组合称为混合半参数模型。表 1概述了主要优点和缺点。


数据驱动的模型


数据驱动或经验模型试图根据预定义设计空间内的观察实验来描述输入-输出关系,例如人工神经网络 (ANN)、统计和回归模型。生物制药行业经常使用统计模型,通过使用DoE 和适当的统计数据分析方法(例如响应面方法(RSM))执行一组预定义的实验,或者通过使用现有数据集进行多元数据分析。RSM 是一个众所周知的经验模型,它描述了DoE 内不同测试因素之间的响应关系,并生成了一个描述数学关系的模型。该统计(黑盒)模型仅观察因素与响应的相关性,而没有获得对估计参数的基本机械(物理化学)理解。通过一阶和二阶多项式利用DoE 和回归分析,可以估计最佳输入组合。然而,将数据拟合到二阶多项式是RSM 的一个主要缺点,因为通常并非系统内的所有曲率都可以用二阶多项式来描述。DoE与经验模型相结合已广泛应用于生物制药行业和学术界的下游纯化工艺设计。有研究人员使用DoE 和线性回归模型研究了高盐溶液对 RNA 沉淀和 pDNA 回收的影响。最近,Chiang等人利用 DoE,评估了在从单柱操作切换到多柱操作时,层析参数对病毒清除的影响。数据驱动模型的一个主要限制是它们仅在测量变量的定义区域内有效,并且只能预测该区域内的变量,这使得外推通常非常不准确。此外,可以提取的工艺知识很少,因为参数通常只是相关性。另一方面,与机械建模相比,数据驱动建模不需要提前了解工艺,并且耗时更少。


机械建模


机械、第一原理的或知识驱动的模型试图根据有关工艺的知识来描述工艺或系统中发生的内部机制和现象。这些模型由物料和/或能量平衡以及传输和热力学现象组成,并具有固定的结构,这意味着参数可能具有物理解释。模型参数由实验数据或物理相关性估计。纯化过程中发生的物理过程可以转化为数学模拟模型。一个经过验证的机械模型允许在计算机中探索各种条件,因此能够有效地获得最佳操作条件。层析柱内发生的现象在文献中有很好的描述,Ruthven已经深入介绍了动力学和吸附过程。动力学或速率模型在实践中最常见,包括分散因素,如传质和分散效应,以及平衡因素,如吸附等温线、离子解离和分子间缔合。三个最突出的动力学模型是集中动力学模型、集中孔隙模型和一般速率模型,它们按复杂程度排列。这些模型的主要区别在于覆盖孔隙扩散效应的程度。然而,其适用于所有力学模型,等温线参数至关重要,如前文所述,其中存在许多结合模型,例如线性、Langmuir、空间质量作用和混合模式。层析模型的使用范围从工艺合成、优化和控制到放大、填料选择和稳健性研究。进一步的步骤是模拟集成式层析和其它调节步骤的组合,以找到最佳整体纯化工艺。目前已有多种层析机械模型的商业化软件可供使用,例如:GoSilico(Cytivia子公司,正式名称为ChromX)、AspenChromatography、DelftChrom、CADET和ChromaTech。


用于吸附实验的计算机替代方法已经研究了几年。分子动力学模拟试图在详细的原子水平上描述填料-蛋白质之间的相互作用。定量构效关系 (QSAR) 将分子特性与经验模型相结合,以发现保留行为和蛋白质表面特性之间的相关性。这种分子模型可用于预测蛋白质在填料上的保留行为,以减少工艺开发时间。然而,通常需要关于每个成分的详细信息,例如氨基酸序列或晶体结构,并且还需要大量的实验。


与数据驱动模型相比,机械模型可以探索更宽范围甚至超出观察到的测量结果的条件,具有更高的外推能力。这有助于工艺理解,符合QbD 倡议,尽管机械建模也需要物理理解。基于知识的模型的主要缺点是它们的复杂性,因此与数据驱动模型相比需要更多的开发时间。


混合(半参数)建模


混合(半参数)建模将参数(即基于第一原理、机械和知识的模型)与非参数(即数据驱动模型)相结合,以消除个别方法的缺点并充分利用两者。VonStosch等人广泛回顾了混合半参数建模框架和生物化学工程中有关过程监测、控制、优化、模型缩减和放大的各种应用。参数和非参数模型可以串联或并联配置,具体取决于模型的范围。当机械(白盒)模型性能有限或不够准确时,通常建议使用并行模式,并且添加非参数(黑盒)模型可能会改善评估,如图4c串行方法通常用于通过使用非参数模型确定参数来降低机械模型的复杂性,如图4a,或者当机械模型的结果作为非参数模型的输入时,如图4b


图4. 混合建模配置,白盒表示机械/第一原理模型,黑盒表示数据驱动模型。串行方法 (A, B) 和并行方法(C)。


混合建模的有用性在于它能够经济高效地解决复杂问题并开发模型。除了获得更广泛的工艺理解外,其它优点还包括优化的模型精度、透明度和外推特性。然而,挑战在于了解以何种方式可以组合不同类型的模型来开发混合模型。因此,需要对数据驱动模型和机械模型有透彻的了解,以及获取正确数据的知识。混合建模越来越受到工业界和学术界的关注,并且似乎是克服数据驱动和机械模型缺陷的一种很有前途的方法。


原文:D.Keulen, G.Geldhof, O.L.Bussy, et al., Recent advances to accelerate purification process development: a review with a focus on vaccines. Journal of Chromatography A, 2022, https://doi.org/10.1016/j.chroma.2022.463195.