《药物临床试验协变量校正指导原则》征求意见稿

 收藏

关键词：临床药物药征求意见

资讯来源：天士力研究院

发布时间： 2020-08-20

为了促进药物临床试验各相关方了解试验中协变量校正的意义及处理的相关技术要求，经广泛调研和讨论，我中心组织起草了《药物临床试验协变量校正指导原则（征求意见稿）》。

我们诚挚地欢迎社会各界对征求意见稿提出宝贵意见和建议，并及时反馈给我们，以便后续完善。征求意见时限为自发布之日起1个月。

您的反馈意见请发到以下联系人的邮箱：

联系人：潘建红、孙凤宇

联系方式：panjh@cde.org.cn，sunfengyu@cde.org.cn

感谢您的参与和大力支持。

国家药品监督管理局药品审评中心

2020年8月19日

附件1：《药物临床试验协变量校正指导原则（征求意见稿）》

附件2：《药物临床试验协变量校正指导原则（征求意见稿）》起草说明

附件1：

药物临床试验协变量校正指导原则

（征求意见稿）

2020年8月

一、概述

二、试验设计中有关协变量的考虑

(一)常见的重要协变量

(二)随机化的分层因素

(三)对协变量数量的控制

三、校正协变量的统计分析方法

四、结果的报告和解读

(一)基线变量的特征分析

(二)协变量缺失的处理

(三)协变量校正方法的选择

(四)校正与未校正协变量的分析

(五)协变量与处理因素交互作用的探查

参考文献

附录1：词汇表

附录2：中英文对照

附录3：不同类型终点变量的协变量校正方法和统计学考虑

药物临床试验协变量校正指导原则

一、概述

在随机对照临床试验中，除处理因素以外还存在其他协变量，如果在试验设计时不进行有效控制，或在统计分析时不进行合理的校正，则可能使检验效能降低，或使疗效估计产生偏倚。因此，在随机对照临床试验中对于协变量的处理应予以慎重考虑。

本指导原则中，协变量是指在干预之前（通常是在随机化之前）观测到的，并且预期与主要研究结果有关联的变量。校正协变量的意义是使得对于任意一个受试者，随机分组到试验组或对照组的预期疗效差异与协变量的观测值无关。由于随机分组的原因，随机对照试验中的各个协变量的取值在试验组与在对照组的概率分布是相同的，而任何观测到的分布不均衡都应归结于随机抽样误差。因此，随机对照试验中协变量校正的主要目的是减少终点变量中与处理因素无关的冗余变异以及疗效估计中因抽样误差而产生的偏倚，从而更准确地估计疗效。协变量可以是连续型的、有序分类的或无序分类的。人口统计学指标（如年龄或体重），疾病特征（如病程或严重程度），预后因素，病理学结果、生理学因素，遗传因素，以及研究中心或研究者等都可能是协变量。同时，主要疗效指标的基线值也可能是非常重要的协变量。

在临床试验中，为了保证入组受试者对于目标人群的代表性，试验受试者的协变量通常对应一定的取值范围。尤其是当协变量对终点变量影响较大时，终点变量的变异度会增加，导致疗效估计误差增大、相关假设检验的效能降低。因此，如何识别并控制潜在的协变量，更科学合理地分析处理因素与终点变量间的效应关系是临床试验中的关键问题。

本指导原则旨在阐明随机对照临床试验中协变量的处理原则，并为试验设计，统计分析和临床试验报告中如何处理重要的协变量提供建议。主要适用于药品的确证性临床试验，对于探索性研究也具有参考意义。

二、试验设计中有关协变量的考虑

在临床试验中，有关协变量校正的考虑起始于试验设计阶段，并需要在研究方案中事先确定。实际临床试验中可能有很多协变量与主要研究结果有关。因此在试验设计时需要识别重要的、具有生物学意义和临床意义的协变量，并在随机分组时加以控制，在统计分析时加以校正。

(一)常见的重要协变量

1.与终点指标关联性较强的协变量

如果协变量与主要终点指标有较强的关联性，协变量的变异以及抽样误差更有可能影响终点变量，造成疗效估计的误差增大以及相应的统计学检验效能降低。因此，通常需要将该协变量引入疗效分析的统计学模型中以提高疗效估计精度。

例如，某病情评估指标属于反映受试者的病情严重程度的连续型变量，并且在基线和干预后均有观测。无论疗效的评估是基于该指标在治疗终点时的实际取值，还是治疗终点时较基线的取值变化，评估结果均与基线取值有较强的关联性。此时，该疾病评估指标的基线取值应纳入统计分析模型中，以在疗效估计时进行相应的协变量校正。

2.变异性较大的协变量

对于变异性比较大的协变量，尤其是在样本量不大的情况下，随机分组可能出现基线不均衡。即使该协变量与主要终点的关联性相对不强，也有可能导致疗效估计时产生偏倚。同时，协变量的变异增大可能增加终点变量的变异，导致疗效估计的精度下降。因此，可以考虑把预期变异较大的协变量引入疗效估计的统计分析模型中，以校正协变量对疗效评估带来的潜在影响。

3.中心因素

在多中心随机对照临床试验中，各研究中心在临床实践、试验条件、受试者基线特征等方面可能存在不同程度的差异，而这些因素可能或明确与终点指标相关，故而在多中心临床试验中通常会选择中心因素作为需要校正的协变量。特别是在国际多区域临床试验中，不同区域的受试者可能存在种族、文化、饮食习惯、临床实践等方面的差异。区域因素通常综合性地包含这些特征和信息，可以考虑以国家或区域分类作为中心因素进行校正。当试验中心数量较多时，单个中心预期入组病人数量可能非常有限。以中心为协变量进行校正通常会带来技术层面和结果解读方面的挑战。此时，可以考虑不对中心因素进行协变量校正，或按预先定义的方式合并中心（或国家/地区）后进行校正。

(二)随机化的分层因素

在随机对照临床试验中，往往会将与终点变量有较强关联性的协变量（如预测或者预后变量）按取值进行分类，采用分层随机的方法将受试者分配到不同治疗组中，以进一步降低组间协变量的不均衡和控制偏倚。分层因素建议不宜过多，通常需要在统计分析模型中加以校正。

(三)对协变量数量的控制

如果在统计分析模型中纳入过多的协变量，特别是与终点变量关联性不大或者相互之间相关性很强的协变量，可能导致协变量某些取值组合情况下的样本量很少。这种情况下，经过协变量校正的疗效估计可能产生偏倚，检验效能出现下降，甚至可能导致模型的过度拟合、模型信息矩阵奇异等问题，给统计分析结果的科学性、可靠性、适用性和可解释性提出挑战。因此应在试验设计阶段尽可能地选取具有临床意义、与试验终点变量相关性强的关键协变量，以控制纳入统计分析模型的协变量个数。事实上，在随机对照临床试验中，除了分层因素等常规需要校正的协变量外，纳入统计分析模型的协变量数量建议尽可能少。

三、校正协变量的统计分析方法

在随机对照临床试验中，通常基于终点变量的类型选择不同的校正协变量的统计分析方法。例如，对于连续型疗效终点变量，协变量校正通常采用线性模型来完成；对于时间-事件（time to event）型终点变量，协变量的校正通常通过Cox模型来完成；对于二分类疗效终点变量（如有效/无效），群体终点变量（summary endpoint）可以是处理组之间的率差（Rate Difference,RD）、率比（Rate Ratio,RR）、或率的优势比（Odds Ratio,OR）。不同的二分类的群体终点变量需用不同的协变量校正的统计学模型。例如logistic回归模型可以用于终点指标为OR的协变量调整。

采用统计分析模型对协变量进行校正时，需要关注模型的适用性要求。例如，协方差分析模型需要进行残差分析和方差齐性评估，而Cox模型需要考虑比例风险模型的假定是否满足等。

四、结果的报告和解读

除了在设计时采用分层随机控制协变量，在分析时用合适的方法对协变量进行校正以外，在研究总结报告中还要注意正确解释协变量对主要分析结果的影响，通过敏感性分析评价主要结论的稳健性，并且在试验报告中进行充分讨论。

(一)基线变量的特征分析

在随机对照试验中，一般需要报告各处理组的基线变量特征。由于是随机分组，基线变量的组间差异来自于随机误差。因此基线数据的分析和报告通常基于各处理组的描述性统计，而不进行假设检验或统计推断。

如果出现非预期的基线变量在各处理组间明显不均衡的情况，这可能影响疗效的估计。此时，可以考虑在统计分析计划内容以外增加补充分析对该协变量进行校正，进一步评估主要分析结论的稳健性。需要注意的是，事后的补充分析主要以探索性评价为目的，并不改变主要分析的结论，在结果评价中通常不被优先考虑。

(二)协变量缺失的处理

由于基线数据采集、记录、受试者基线数据可用性等多种原因，有时会导致基线协变量的缺失。如果将基线协变量缺失的受试者剔除进行分析，不仅与ITT原则产生违背，同时会导致检验效能的降低以及潜在偏倚的出现。因此，应该在合理的假设下对基线协变量缺失的数据进行填补，并进行预设的敏感性分析，为主要分析结论提供支持。研究总结报告中需要报告基线的缺失情况以及采用不同填补方法的敏感性分析结果。

(三)协变量校正方法的选择

协变量的校正通常基于特定的统计模型，且基于一系列假设，分析结论的解读应该结合模型假设的合理性。如果所选分析模型的假设不成立，可能导致对治疗效果的错误估计。对模型的假定是否成立需进行判断，并且应在方案中进行预先计划。若发现对模型假定有较大的偏离，需在最终研究总结报告中予以描述，并与其他更为合适方法的分析结果进行比较，以评估主要分析结论的稳健性。

(四)校正与未校正协变量的分析

在随机对照临床试验中，协变量校正的分析方法常常在试验设计阶段被预设为主要分析方法。同时，建议考虑采用未校正协变量的方法作为敏感性分析。当校正和不校正的结果相差较大，尤其是这种差异不能用处理组间协变量的不均衡来解释时，则需要进行进一步的深入探讨。

(五)协变量与处理因素交互作用的探查

一般情况下，确证性临床试验的主要目的是衡量处理在全目标人群中的整体效应。主要分析中通常不会纳入协变量与处理因素交互作用项，而在敏感性分析中可以考虑对协变量与处理因素的交互作用进行统计分析。

事实上，除非在设计时有针对性的考虑，临床试验往往都不具有足够的检验效能对协变量和处理因素的交互作用进行检验。然而，有时进一步探索关键的协变量（如分层变量）与处理因素潜在的交互作用是有必要的。比如，多区域临床试验中，有时对区域与处理因素间的交互作用进行检验可以协助探索区域疗效是否存在不一致性。

如果协变量和处理因素存在具有统计学和临床意义的交互作用，这说明疗效可能在分层人群中有所不同。这种情况下，需从临床角度对交互作用的潜在来源、对主要分析（无交互作用）结果的影响，以及基于主要分析的结论予以谨慎解释和充分讨论。如果在进一步的分层亚组分析中，发现不同分层亚组中的疗效组间差异有明显不同且临床疗效结论是相反的（如：某个层：试验药的疗效明显优于对照药；另一个层：对照药的疗效明显优于试验药），则需要进行进一步的分析以对试验结果的不一致提出科学合理的解读。

另一方面，由于交互作用的检验通常缺乏足够的检验效能，因此对于交互作用的检验即使没有统计学意义也不足以完全证明分层亚组间疗效的一致性。

参考文献

[1] Altman D, Dore C. Randomization and baseline comparisons in clinical trials. The Lancet, 1990, 335(8682):149-53.

[2] Beach M L, Meier P. Choosing covariates in the analysis of clinical trials. Controlled Clinical Trials, 1989, 10(4):161-175.

[3] Committee for Proprietary Medicinal Products (CPMP), Points to consider on adjustment for baseline covariates. Stat Med. 2004; 23: 701-709.

[4] D. Tu, K. Shalay, and J. Pater, Adjustment of treatment effect for covariates in clinical trials: statistical and regulatory issues. Drug Inf J. 2000; 34: 511-523.

[5] EMA. Guideline on adjustment for baseline covariates in clinical trials. 2015

[6] FDA. Adjusting for Covariates in Randomized Clinical Trials for Drugs and Biologics with Continuous Outcomes. Guidance for Industry (DRAFT GUIDANCE). 2019

[7] G. Raab, S. Day, and J. Sales, How to select covariates to include in the analysis of a clinical trial. Control Clin Trials 2000; 21: 330-342.

[8] S. Assmann, S. Pocock, L. Enos, and L. Kasten, Subgroup analysis and other (mis)uses of baseline data in clinical trials. Lancet. 2000; 255: 1064-1069.

[9] Senn S. Covariate imbalance and random allocation in clinical trials, Statistics in Medicine, 1989, 8(4):67–75.

[10] Tukey J W. Use of Many Covariates in Clinical Trials. International Statistical Review, 1991, 59(2):123-137.

[11] 赵耐青，陈峰. 基线与协变量. 见陈峰，夏结来主编. 临床试验统计学（第十三章）. 人民卫生出版社. 2018. 202-210.

附录1：

词汇表

协变量（Covariate）：在干预之前（通常是在随机化之前）观测到的，并且预期与主要研究结果有关联的变量。

多区域临床试验(Multi-regional clinical trial,MRCT)：一项按照单个方案在多个地区实施的临床试验。

分层随机（Stratified randomization）：依据关键因素（如年龄、性别、种族、疾病状态等）对研究对象进行分组（层），然后在每层内分别进行的随机化。分层随机可以有效地提高在关键因素或者特别关注的研究对象亚组中分布的平衡性。用于定义分层的因素称为分层因素。

过拟合（Over-fitting）：在数据分析（如，建模）中过于精确的契合或匹配某一数据集，导致分析结果与额外的观测数据不匹配或者无法可靠地预测未来的观测结果。

交互作用（Interaction）：当某一个因素（协变量）对于结局变量的影响随另一因素变化而变化时，则称这两个因素之间存在交互作用。

附录2：

中英文词汇对照

附件2：

《药物临床试验协变量校正指导原则（征求意见稿）》

起草说明

一、背景和目的

在随机对照临床试验中，除处理因素以外还存在其他协变量，如果在试验设计时不进行有效控制，或在统计分析时不进行合理的校正，则可能使检验效能降低，或使疗效估计产生偏倚。因此，在随机对照临床试验中对于协变量的处理应予以慎重考虑。为了保证入组受试者对于目标人群的代表性，试验受试者的协变量通常对应一定的取值范围，尤其是当协变量对终点变量影响较大时，终点变量的变异度会增加，导致疗效估计误差增大、相关假设检验的效能降低。因此，如何识别并控制潜在的协变量，更科学合理地分析处理因素与终点变量间的效应关系是临床试验中的关键问题。

二、起草过程

本指导原则的起草小组基于药审中心与南方医科大学战略合作建立的三方学术协调委员会，由学术界、制药工业界和监管机构代表共同组成，保证了本指导原则高效、高质量完成。

本指导原则自2020年3月正式启动，分别于2020年5月和7月召开两次专家研讨会，并经药审中心内部征求意见与审核，形成征求意见稿。

参与制订本指导原则的专家名单见附录，在此一并致谢。

三、指导原则框架

本指导原则分为五个部分，内容如下：

（一）引言

主要阐述了本指导原则制定的背景、目的和应用范围。

（二）试验设计中有关协变量的考虑

主要阐述了协变量校正的考虑起始于试验设计阶段，需要在研究方案中事先确定。在试验设计时需要识别重要的、具有生物学意义和临床意义的协变量，并在随机分组时加以控制，在统计分析时加以校正。详细说明了常见的重要协变量，随机化的分层因素考虑以及协变量数量的控制。

（三）校正协变量的统计分析方法

阐述了在随机对照临床试验中，通常基于终点变量的类型选择不同的校正协变量的统计分析方法以及注意事项。

（四）结果的报告和解读

阐述了在研究总结报告中还要注意正确解释协变量对主要分析结果的影响，通过敏感性分析评价主要结论的稳健性，包括基线协变量的特征分析、协变量缺失的处理、协变量校正方法的选择、校正与未校正协变量的分析和协变量与处理因素交互作用的探查。

（五）附录

本指导原则的附录部分包括定义和缩略语。