设备说|向创新技术要经济效益—PAT技术+多元变量统计应用
收藏
关键词:
新技术
资讯来源:生物制品圈 + 订阅账号
发布时间:
2022-10-07
在国内有时在一些场合偶会听到有关对PAT技术的看法,例如:技术华而不实,虚头巴脑;技术不成熟,很难有应用;国内行业环境没有这个技术落地的土壤等等。但是我想说的是,他们殊不知现在PAT技术已经开始应用到大千世界,神州大地,遍地开花,硕果累累。例如:A股一哥茅台早早就尝试将近红外技术应用在白酒的快速在线质检环节;被台湾榨菜哥封为人间佳肴的涪陵榨菜也采用了近红外技术用于产品的快速放行;就连祖国西部边陲的名城阿克苏出口的红富士苹果都插上了技术的翅膀,将在线检测技术用于快速对农药残留进行检验。所以我想提出的问题是,难道茅台、涪陵榨菜、红富士苹果产区有神经病,吃力不讨好的用新技术来粉饰自己?那肯定不会,只能说新技术的应用给他们带来了切实的效率提升。
任何新的技术的应用,并不是孤立的孤芳自赏,更是各尽其能的组合式创新。打个不恰当的比方,未来的生物制药产业就应该像张无忌,不仅学会了义父金毛狮王的七伤拳,还阴差阳错地练就九阳神功,随后还得到太师傅张三丰的太极拳真传。各路流派,融会贯通,方成一时豪杰。所以说生物工艺的从业者们,更应该开放心态,拥抱创新。不要输在看不见,看不起,看不懂,来不及上。
该案例来自于知名企业GSK的微生物和细胞培养开发部门,该部门来自于坐落在宾夕法尼亚州的GSK北美总部。该案例于2019年作为美国化学会春季国际会议的报告首次发布,今年又被《Biotechnology Progress》接受,并于9月刚接收[1]。这篇文章的亮点之处在于,其探索工作证明了PAT技术+多元变量统计工具可以为生物制药的生产效率和经济效益带来切实提升。
对于抗体制药工业而言,细胞株是最为重要的生产原材料。很大程度上细胞株决定了最终培养的Titer和抗体糖型。我们都知道反应器的温度,DO,培养基配方和培养环境都会对Titer和糖型有影响[2],GSK的工作人员通过过往数据和已发表文献,发现乳酸作为CHO细胞的一种自身代谢产物,不仅可以被细胞自身产生,还可以被自身消耗。同时GSK的研发团队通过大量数据积累推测,如果有一种补料方式能将培养过程中的葡萄糖和乳酸浓度分别平稳地控制在4g/L和2g/L,将获得抗体糖基化效率的提升。
对于稳定地将乳酸和葡萄糖地浓度精准控制的愿望而言,单靠眼下常规的定时定量补料手段显然无法达到。主要因为该方式对整个培养过程中的反馈调节控制节点过少,造成目标物浓度的脉冲式波动,细胞在这种环境下显然也不能稳定的进行相对应的糖基化合成。既然目前的方式不行,那就只能从其它行业找寻可能的解决方案,Raman光谱就在这时逐渐进入了开发人员的视野。Raman光谱作为一种对样品无损害的分子光谱,能够在线对样品的瞬时状态进行谱图数据采集。相较于传统生化分析仪等Off-Line检测手段,传统检测时间和反馈调节时间中间会有一个时间间隔。该时间间隔就会造成目标物质浓度的调节有一个时间延迟效应,并不准确。而且该方式也只对少数几个时间节点进行操作,其余大部分时间的培养过程中,目标物质浓度实际上是一个黑箱。Raman的超快速特性,使得在线高频检测目标物浓度,高频反馈调节控制方案具备实施的理论基础。
Raman光谱不同于传沟的检测手段,其检测图谱是对样品整体状态进行瞬时捕捉。所以谱图数据中不仅包含了目标物质葡萄糖和乳酸的信息,还包含了大量的其它分子和细胞、培养基组成、代谢废物等物质信息。为了从分子光谱中蕴含的混沌复杂信息中抽提出关键信息用以计算葡萄糖和乳酸的浓度。GSK的同仁们做了以下事情,见图1。

该流程图中的第一步也就是GSK同仁先明确了他们此番工作的目的:建立出行之有效的统计预测模型,将Raman光谱的瞬时图谱数据作为input数据,用以预测当下培养过程中的葡糖糖和乳酸浓度。
为达成该目标,第二步GSK很显然花费了大量的精力来攒数据,首先建立了标准样品集:0-21.53 g/L和0.04-9.3 g/L的葡萄糖和乳酸标准液,用于获取不同浓度下葡萄糖和乳酸的Ramen光谱数据。另外,通过实际培养过程获取培养液的Raman光谱数据,一般的模型建立只需4-6批反应器的Raman光谱数据即可,但GSK却足足运行了61批培养实验和相对应的off-line的质检测试。这显然是花费了大量的心血在上面,不成功则成仁。
第三步是对采集到的光谱数据进行预处理,文中并未对数据处理方法的筛选做出太多的说明,但可以猜测到数据处理的方法选择和衡量是一个模型建立成功与否非常重要的因素。该案例依次使用了标准归一化变化(SNV), Savitzky-Golay卷积平滑,导数处理 (15-point window, 2nd order polynomial, 1st derivative,where 1 point = 1 cm-1 )和中心化处理等数据预处理方法来解决基线漂移、瑞利散射和仪器背景信号等问题。作为多元统计模型建立的关键,数据处理质量决定了模型的稳健性与否。但是在数据处理这块,GSK的同仁并未详细阐述数据处理方法是如何选取的,选取标准是什么?因为其重要性,有兴趣的读者可以参考相关资料[3]。
第四步就是将收获的光谱数据作为X和离线测定的葡萄糖及乳酸浓度数据Y进行模型关联。以葡萄糖浓度预测模型为例,该文尝试了3种不同的PLS拟合模型。第一个模型采用了24个反应器中获取的Raman数据,共计491张谱图,选择400-1600cm-1波段。潜变量设定为7个进行建模。该模型1的葡萄糖预测浓度和离线测定浓度的散点图,见图2(a),独立测试2批的数据见图3(a)。可见在图3(a)中的培养后半段,也即从第9天开始,离线测定的葡萄糖浓度和模型1预测的葡萄糖浓度开始出现较大偏差,随着时间的推移这个偏移值越来越加剧。GSK推测该问题的出现是由于随着细胞密度的增加,细胞碎片的积累导致了预测模型的数据失真。在这种情况下,GSK的工作人员开始着手建立模型2,模型2建立的光谱数据还将独立运行批的谱图也包含进来,进一步筛选了316个波段,采用了4个潜变量的遗传算法(Genetic Algorithm)的PLS模型拟合,希望能够解决掉细胞碎片产生的信号干扰。模型2的葡萄糖预测浓度和离线测定浓度的散点图见图2(b),独立测试2批的数据见图3(b)。模型2的独立运行批的数据相较模型1,其预测葡糖糖浓度已经和离线测定值大为接近,但是11天时也出现了预测值的距离波动,且预测值和实测值也出现了数值反向波动的异常点(尤其是12-16天的数据)。GSK工作人员本着精益求精的精神,推测该情况是由于样本测试数据和独立运行批所采用的Raman设备不是同一台仪器造成。进一步开始构建模型3,模型3的原始数据将不同的Raman设备采集的所有1162幅光谱图中的所有波段都囊括进数据库,设定5个潜变量进行PLS建模。最终的葡萄糖预测浓度和离线测定浓度的散点图见图2(c),独立测试2批的数据见图3(c)。从图3中可以看到预测值和实测值已经非常收敛于设定值4g/L附近,RMSEC值为0.25-0.42g/L,这是在可接受校的准误差范围内。这说明建立的模型3已经非常稳定的可应用于实际培养中。
当然GSK的同仁,并非仅从图3来对模型的稳定性进行判定,毕竟独立实验只进行了2次,数据量并不够大。所以对于模型的评判还借助了R2X,R2Y,Q2,RMSEC和RMSECV的结果来进行比较,这里不再赘述,可以参见原文。乳酸浓度的预测模型和葡萄糖预测模型建立过程类似,在此不细表。唯一的区别在于,乳酸浓度的调控开启始于细胞进入乳酸消耗阶段。
上述所涉及的葡萄糖控制回路是通过DCS系统的PI比例积分控制回路来执行。遗传算法是通过MATLAB执行。其它的PLS建模和数据处理是通过SIMCA执行。至于为什么将葡萄糖和乳酸浓度分别控制在4g/L和2g/L就可以提高糖基化效率,GSK的工作人员在原文中进行了分析和阐述,在此也不赘述。最终GSK的工作小组通过该技术的应用,最终的培养结果是氨物质浓度降低了68%,半乳糖基化的抗体产量提升了50%。这多出来的糖基化产物都是利润,你说它香不香。

图2 模型预测葡萄糖浓度与离线检测葡萄糖浓度散点图。(a)(b)(c)分别为三次不同的建模处理

图3 独立运行的2批反应器模型预测葡萄糖浓度与离线测定葡萄糖散点图。(a)(b)(c)分别为三次不同的建模处理情况
创新技术的应用终归是需要一个发展过程的,其最重要的关隘在于是否有技术人才来实现其应用。真心建议生物制药产业的相关人员能够更多的涉猎数据处理和自动化的领域知识,扩展自己的能力圈,才能更好地进行组合创新,不仅为企业创造经济价值,也为自己的增值打下坚实基础。
作者介绍
求学于分析化学,谋职在生物制品,热诚为行业分享,方向却不取一边,入行已有千日夜,内心仍此间少年,执笔希君多智选,还看设备面面观。
往期作品
[1] Tuning Monoclonal Antibody Galactosylation using RamanSpectroscopy-Controlled Lactic Acid Feeding, Thomas Eyster, Sameer Talwar,Janice Fernandez, Shelby Foster, James Hayes, Randal Allen, Scot Reidinger,Boyong Wan, Xiaodan Ji, Juan Aon, Pramthesh Patel, Diana B. Ritz, BiotechnologyProgress [J], doi: 10.1002/btpr.3085
[2] Optimal and consistent protein glycosylation in mammaliancell culture, Hossler P, Khattak SF, Li ZJ, Glycobiology [J]. 2009, 19(9):936-949.
[3] 近红外分析中光谱预处理及波长选择方法进展与应用,; 褚小立, 袁洪福, 陆婉珍,; 化学进展 [J]. 2004, July, Vol 16 (No.4).
