
在准备做确证性随机试验(definitive randomized trials)时,预试验(Pilot trials)起着关键作用。但如何确定预试验的样本量仍是一个挑战。
2025年8月,BMJ发表了一篇方法学文章,为预试验样本量计算提供了实用的指导建议和工具,包括分步示例、样本量表格以及统计代码。R Shiny应用程序以及常用软件(如R、Stata、SAS)的统计代码可在线获取:https://github.com/xiying5/PilotSize
原文链接:https://www.bmj.com/content/390/bmj-2024-083405.long
与确证性试验不同,预试验和可行性研究不估计或检验疗效,因此"初步疗效(preliminary efficacy)"等表述具有误导性。预试验旨在确定"是否可以做,是否应该继续进行,如果继续、该如何做"等问题。
研究者通常不确定在预试验中应纳入多少参与者。由于预试验的目标不是估计或检验干预疗效或效果,确证性试验的传统样本量计算方法无法直接适用预试验。在实践中,研究者经常依赖经验,这些经验可能适用于某些预试验,但并非所有预试验。预试验报告中也经常缺少样本量说明。
预试验可分为内部预试验(嵌到确证性试验中,数据纳入最终分析)或外部预试验(独立研究,数据不进入确证性试验的分析)。BMJ本次发布的文章,重点关注外部预试验,因此以下方法可能不直接适用于内部预试验。本文主要关注两组随机化试验设计,不涉及更复杂的设计,如整群随机试验或适应性试验。
以下是基于不同目的开展预试验时,计算样本量的步骤和注意事项。
确定确证性试验的可行性
许多预试验旨在通过模拟未来试验的方法,评估试验方案的可行性,可能旨在回答以下问题:
- 研究能否达到所需的招募率?
- 随机化对参与者来说是否可接受?
- 研究团队能否保留参与者在研究中?
研究者使用预试验中收集的信息,做出是否开展以及如何开展确证性试验的决策。
估计可行性参数
关于可行性的判断,通常取决于一个或多个特定参数(如招募率、脱落率、参与者随机化意愿)。由于这些参数通常未知,研究者可通过预试验来进行估计。要确定精确估计时所需要的样本量,必须明确三个方面:
- 参数的预期值(例如,10%的参与者会退出试验)
- 期望的精确度水平,或置信区间(CI)半宽(例如,±10%)
- 置信水平(通常为95%,单侧或双侧)
估算可行性参数(实操示例)
示例 1:脱落概率(Dropout probability)
为了解参与者在确证性试验中可能的脱落程度,研究者设计了一项预试验来估算脱落概率。
- 根据经验推测,脱落率约为10%。
- 研究者的目标是以10个百分点的精度来估算该参数(即置信区间的宽度为20个百分点)。
- 他们计划使用95%单侧置信区间,因为他们主要关注置信区间的上限(即是否超过20%)。
- 研究人员需要在预试验中招募26名参与者(每组13名),这样才能获得最大宽度为20%(0%到20%)的95%置信区间。


确认删除