ROC曲线中,状态这个栏目该怎么纳入数据?
课题:研究腋窝淋巴结阳性比率对于乳腺癌预后的相关性分析。
步骤:
使用受试者工作(ROC)曲线分析LNR值,以找出LNR的临界值。计算曲线下面积(AUC)和95%置信区间,以评估LNR值的准确性。 Kaplan-Meier方法用于计算DFS和OS。生存曲线之间的比较使用Logrank检验进行。 Cox回归模型用于生存结果危险因素的多变量分析。P<0.05为有统计学差异。
问题:
使用ROC曲线寻找临界值的过程中出现问题。
一
检验变量:淋巴结阳性比率(每一个病人的腋窝淋巴结阳性数目除以淋巴结清扫总的数目得出来的一个比值)
状态变量:以5年为观察期,5年内复发,转移设置为1,无复发,转移设置为0,得出一列数据,作为ROC曲线中的状态变量
结果:AUC值:0.64 临界值:0.34,特异度0.473,灵敏度0.77 。
二
检验变量:淋巴结阳性比率
状态变量:1年内复发,转移设置为1,无复发,转移设置为0,得出一列数据,作为ROC曲线中的状态变量
结果:AUC值0.769 临界值:0.375 特异度:0.747 灵敏度:0.769
从AUC值来看,毫无疑问是第二种计算方法的结果更好看,主要问题是按照第二种算法,找出临界值为0.375(>0.375的患者是高风险组,设置为1,<0.375的为低风险组,设置为0),再下一步绘制KM曲线和进行cox单多因素回归时,是不是必须把时间设置为12个月内?即使患者观察60个月也未出现复发、转移,仍然只算12个月?