观察性研究中的时间依赖性混杂,到底是什么?

专题合集更多教程

作者:胥洋

 

在讨论如何处理观察性研究中时间依赖性混杂(how)之前,我想我们有必要先回答两个问题:

 

一是what,即什么是时间依赖性混杂?

 

二是why, 即为什么传统的分层/回归的方法处理时间依赖性混杂会失效?

 

what

 

 

 

举例来说,现要研究注射胰岛素与口服二甲双胍相比,患者死亡风险升高还是降低?为了简化问题,排除患者两种药物同时用和同时不用的情况。设注射胰岛素取值为1,口服二甲双胍取值为0。

 

无论是在传统的观察性研究中还是现代的观察性研究中,我们的目的都是为了得到暴露对于结局的因果效应,而如何得到因果效应呢?

 

假设不存在选择偏倚和测量偏倚,在传统的观察性研究中就是要控制基线时间点上所有可能混杂变量(potential confounder),即非时间依赖性混杂(time-fixed confounding);

 

在现代的观察性研究中就是要控制随访时间段上各期的所有可能混杂变量,即时间依赖性混杂(time-varying confounding)

 

时间依赖性混杂根据当期的时间依赖性暴露取值与下一期的时间依赖性混杂取值之间的关系,可以分为无中介作用的时间依赖性混杂(图1)和有中介作用的时间依赖性混杂(图2)

 

图1 无中介作用的时间依赖性混杂,即 E对 Ck+1 无影响

 

图2 有中介作用的时间依赖性混杂,即 E对 Ck+1 有影响

 

why

 

统计学中控制混杂的方法无非有三种,限制(restriction),分层(stratification)/回归(regression),标化(standardization)/加权(weighting),其中分层/回归在流行病学研究中被大量的使用来控制混杂。

 

那么分层/回归在时间依赖性的情况下是否还能有效地控制混杂,进而得到暴露对结局的因果效应呢?

 

答案是:视情况而定(it depends)。

 

 

图3

 

(for static strategies, a sufficient condition for identification of the causal effect of treatment strategies is that, at each time k, all backdoor paths into Ek that do not go through any future treatment are blocked)。

 

我们先来分析一下图1

 

图1 无中介作用的时间依赖性混杂,即 E对 Ck+1 无影响

 

当我们按照 C分层或把 C纳入回归模型时,暴露 Ek 与结局 Y 之间的两条backdoor pathway就被blocked。

 

当我们按照 Ck 和 Ck+1 分层或把 Ck 和 Ck+1 纳入回归模型时,暴露 Ek+1 与结局 之间的三条backdoor pathway就被blocked。

 

因此,在此种情况下,回归/分层是有效的

 

我们再来分析一下图2

 

图2 有中介作用的时间依赖性混杂,即 E对 Ck+1 有影响

 

当我们按照 Ck 分层或把 C纳入回归模型时,暴露 Ek 与结局 之间的三条backdoor pathway就被blocked。

 

当我们按照Ck 和 Ck+1 分层或把 Ck 和 Ck+1 纳入回归模型时,暴露 Ek+1 与结局之间的四条backdoor pathway就被blocked,但是这条backdoor pathway却被打开了。

 

因此,在此种情况下,回归/分层是无效的

 

附录:有向无环图(DAG)

和D-separation规则

 

有向无环图常常用于因果推断中表示各变量之间的关系,如图1和图2所示,图上的点表示变量,图上的带箭头的直线表示因果关系,箭头的指向为果,如A→Y表示的就是变量A导致变量Y。

 

要理解D-separation规则,我们首先要定义通路(path)的概念,通路指的是有向无环图上从变量 到变量 之间所有带箭头的直线构成的路线,即假设你现在站在变量 上,你想走到变量 Y,你的每一条路线就是变量 到变量 的一条通路。如果一条通路上含A←...这样的一段,那么这条通路就叫做变量 到变量 的一条backdoor通路。

 

在有向无环图上,一个通路只有两种情况下是被阻断的,一种是一个非碰撞(noncollider)变量被conditioned on,如图3和4,另一种是一个碰撞变量(collider)及其子变量都没有被conditioned on,如图5。

 

碰撞变量指的是在一条通路上,有两个箭头同时指向的变量,即...→ L←...

 

常见的conditioned on的方法为限制(restriction),分层(stratification)/回归(regression)。

 

(A path is blocked if and only if it contains a noncollider that has been conditioned on, or it contains a collider that has not been conditioned on and has no descendants that have been conditioned on.)

 

图3

 

图4

 

图5

 

我们在后面的文章中会详细介绍如何处理时间依赖性混杂,敬请期待!

 

扫码关注“医咖会”公众号,及时获取最新统计教程!

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题