浅谈基于效果反应的适应性随机化 (Response-Adaptive Randomization)

专题合集更多教程

作者:大仙儿

 

什么是RAR

 

从RAR的名称不难猜测,RAR(Response-Adaptive Randomization)指的是对新入组的患者进行随机化的时候,其随机概率依赖于前面已经随机化的患者的效果反应信息。

 

RAR是一种适应性临床试验设计,具体来说又包括多种类型,比如Play-the-Winner设计、Randomized Play-the-Winner设计、Optimal Adaptive Randomization设计、Bayesian Response-Adaptive Randomization设计等。

 

Play-the-Winner设计:如果前一个已经随机化的患者出现了阳性效果反应,则下一个入组的患者也入组到同样的治疗组(注:本文中的治疗组包含通常意义上的试验组和对照组,即所有组),直到出现阴性效果反应,则下一个患者入组至另外的治疗组,并且接下来入组的患者也遵循同样的规则,直到达到设定的样本量为止。

 

很显然,该设计没有遵循随机分组原则,因为下一个患者的分组完全取决于上一个患者的效果反应。如果在分组过程中已入组患者的效果反应被研究者获知,那么其在入组患者的过程中可能会有选择性地挑选患者,造成选择性偏倚。

 

Randomized Play-the-Winner设计: Play-the-Winner设计的选择性偏倚主要是由于下一个患者的分组完全取决于前一个患者的效果反应(即分配概率为100%),为了规避这个问题,很自然的一个办法就是对下一个患者分组时采用不确定性的方法,以一个较大的概率分配至目标治疗组。

 

Optimal Adaptive Randomization设计:这里“Optimal”体现在,随机化要使得试验统计量的方差最小,或者出现阴性效果反应的患者数最少,前者可以实现Power的“最优”,而后者可以实现伦理上的“最优”。具体操作时,基于已入组的所有患者的疗效反应,在预期目标下,计算下一个患者的随机分配概率。

 

Bayesian Response-Adaptive Randomization设计:前面几种设计随机分配概率取决于对治疗组间效果孰优孰劣的判断,但这种判断仅基于小样本量下的效果估计,且忽略了效果估计值的变异大小(即方差),很可能不够准确。如果仅仅依据不够准确的效果估计就将分配概率差别开来显然不够合理。

 

在贝叶斯的方法下,组间效果优劣的判断借助于后验分布来衡量,后验分布充分体现了前期估计的变异性。在信息积累尚且不足时,组间的分配概率也比较相近,直到信息累积足够充分时,组间分配概率才明显区分开来。

 

为什么要进行RAR

 

采用RAR主要是为了实现某些特定的目的,比如:

 

(1) 统计学:最小化试验检验统计量的方差,从而以更少的样本量达到同样的Power,降低成本,缩短试验的时间,或者以同样的样本量获得更高的Power。

 

(2) 伦理学:让更多的患者被分配至效果更好的治疗组中,尽可能让更多参与试验的患者获益,尤其是对照组疗法效果甚微,而患者得不到治疗将发生严重后果的疾病。

 

(3) 试验实施:患者参加临床试验被分配至较为有效的治疗组的概率更大可以提高患者入组的积极性,从而试验得以正常开展。

 

RAR存在的问题

 

(1) 首先,RAR在随机时依赖以随机化患者的效果反应,打破了经典随机化模式,传统的分析方法不再适用,而需要更加复杂的分析方法,以避免增加假阳性率和引入偏倚。可用的方法如Randomization Test。

 

(2) 容易引入选择偏倚。不管是患者还是研究者若知晓分组规则和已入组患者的效果信息,就会对后续分配组别产生倾向性的猜测,这种猜测可能导致不可预知的偏倚风险。

 

(3) 实施复杂。为了避免产生偏倚,很多信息需要保密,这无疑会导致实施流程的复杂化。

 

(4) 要求患者出现效果反应的时间要短,否则下一个患者分组要等待的时间会很长,导致此类设计无法开展。

 

(5) 对于RAR所要实现的目标:Power更高或接受无效治疗的患者更少,有学者通过模拟发现,RAR设计在模拟条件下所能达到的程度比较有限。

 

(6) 可能无法均衡干扰因素。这可能是RAR方法最致命的缺陷(对于确证性临床试验而言)。临床试验之所以采用随机化方法主要目的是为了均衡已知的和未知的干扰因素,从而将效果差异归因于治疗差异。RAR虽然也使用随机化法,但其特殊的规则导致均衡干扰因素的作用在某些情形下会失效。

 

其理想情形是入组的患者是某一同质总体的随机抽样。当这一前提不满足时,例如某些干扰因素会随着入组时间发生改变时,这些干扰因素可能无法达到均衡。下面举一个例子。

 

假设试验仅包含两个ARM,且分为两个阶段入组。在第一阶段,前来参加临床试验的患者男女比例是50% :50%,第二阶段比例为60% :40%。试验第一阶段ARM 1和ARM 2的分配概率分别为50% :50%,第二阶段发现ARM 1效果更好,因此分配概率变为80% :20%。两阶段各入组100人。

 

那么,试验第一阶段入组情况为:

 

第一阶段入组100人的话,以上各有25人,各组男女比例均为1:1,性别因素均衡。

 

试验第二阶段入组情况为:

 

 

各组男女比例均为 3:2,性别因素均衡。

 

然而从试验整体来看:

 

 

ARM 1 男女比例为 73:57=1.28,而ARM 2比例为 37:33=1.12,性别因素不再均衡!

 

对于多中心的临床试验,尤其是国际多中心的临床试验,试验的启动是逐步进行的,往往某些研究中心(或国家)先入组,某些后入组。不同的研究中心往往存在入组患者某些特征不一致,比如国内外的患者就存在明显的种族差异。即便是单中心开展的临床试验,患者的某些特征也可能存在季节差异。

 

临床试验的入组,通常是连续式入组,而连续式入组并不是随机抽样,自然不能满足RAR的前提条件。可以想象,采用RAR设计产生不均衡的可能性还是较高的

 

对于已知的或者发现的不均衡因素我们可以通过模型来做校正,但是未知的因素却无能为力,我们既不知道干扰因素存不存在,更不清楚试验结果发生了什么样的偏倚,因此试验结论的不确定性增大。

 

基于RAR的缺点,监管部门对RAR用于确证性临床试验的态度目前较为谨慎。

 

试验设计时随机化方法的选择不仅要考虑试验计划纳入的人数,还要考虑药物获批后可能获益的人群规模。尽管以上谈了很多RAR的缺点,但对于罕见病,本身患者人群规模就很小,可能一个临床试验所要纳入的患者就几乎涵盖了当下所有患者,在这种情况下,尽可能多的让参与试验的患者接受有效的治疗更加符合伦理性,也更方便试验的开展。

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题