论文中的统计报告建议:生存分析和贝叶斯统计方法
龚志忠

龚志忠

首都医科大学附属北京中医医院

擅长:临床研究数据统计分析、流行病学方法设计、临床预测模型建模与评价
已关注
关注
2021-07-26 来源:医咖会

第七部分:生存分析

许多研究以死亡率或者随访时间内发生的复合终点作为主要结局,这些终点通常采用生存分析的方法进行分析,该方法适用于时间-事件数据,及删失数据

7.1 报告时间-事件分析结果

  • 报告在研究开始时处于风险中的参与者总数,包括总体和各个研究组的人数。
  • 要明确定义在分析中终点事件的组成部分。终点事件例如全因死亡通常是明确的,但是在心血管疾病方面的研究中往往采用的是复合终点,如主要不良心血管事件或临床改善,因此必须明确界定终点事件。
  • 报告在研究随访期间发生终点事件的总数,包括总体和各个研究组的人数。
  • 报告参与者被认为存在终点事件发生风险的时间点,例如随机分组、开始服用研究药物、试验开始的时间点等。
  • 至少有一个反映风险时间的指标,例如发生结局事件的总人时或平均/中位生存时间。
  • 统计信息:当比较组间时间-事件结局的风险差异或所选的危险因素与结局之间的关系时,必须报告汇总的统计结果,如风险比HR、生存率的差异或特定时间点的平均生存时间,或中位生存时间的差异,及其可信区间CI。所用到的统计模型,应该要描述清楚,如果使用Cox比例风险回归模型,则应报告比例风险假设检验结果。
  • 如果使用多因素模型,则应对建模策略进行描述,包括变量选择和验证假设的方法。
  • 图形表示:通常使用kaplan-Meier曲线表示时间-事件数据的结果。对于Kaplan-Meier曲线的表示,应增加一些信息以提高曲线的可解释性。首先,添加阴影区域(即CI)来表示Kaplan-Meier估计的不确定性;第二,添加一个扩展的风险表,其中包含风险参与者的数量,删失的数量,以及在整个研究时间点上发生终点事件的数量。对于时间间隔的确定,可能会根据具体的临床问题而有所不同,例如,一项5年随访的研究可能会选择每1年为间隔,而一项超过90天的研究可能会以30天为间隔。
  • 另一种可选择的方法是在2条Kaplan-Meier曲线中绘制组间差异的估计点,并用阴影区域表示差异的置信区间。
  • 如果文中提到了调整后的生存曲线,那么则必须清楚说明调整的过程。例如,协变量是被设置为其平均值还是选择一些代表值。有一些结局事件作为时间-事件数据分析时可能会发生不止一次(例如住院),可以采用如下统计模型,如Andersen-Gill,Prentice-Williams-Peterson,Wei-Lin-Weissfeld,这些模型允许包含同一患者的多个时间-事件结局。如果使用这种方法,则应该清楚地在文中说明,并对该模型进行充分详细地描述。
  • 依时协变量:如果分析中包含≥1个依时协变量时,则必须清楚区分哪些变量会随着时间变化而变化。
  • 竞争风险也是是一个需要考虑的因素,例如,复发事件和其他具有死亡竞争风险的类似事件。在这种情况下,应该考虑应用竞争风险的分析方法,如Fine and Gray方法,联合模型等,并且同样要报告终点事件的数量。
  • 时间偏倚:在前瞻性研究/试验中,患者处于风险状态的开始时间往往是明确的,通常为随机化或研究治疗的开始时间。但在回顾性/观察性的研究中,就比较更难以识别,从而导致产生时间偏倚。出于这个原因,作者必须清楚地确定患者处于风险状态的开始时间,并要考虑他们的分析策略是否在一个或多个研究组中引入了时间偏倚可能性。