公共数据库的常见分析套路,用这个工具半小时搞定!

近期查看文献时,常看到一些研究使用了公共数据库,例如NHANES数据库,更甚者会对两库进行联合分析。例如医咖会以前的推文:UKB+NHANES数据(IF=16.6):2型糖尿病患者应该上午还是下午运动?

如果再多看一些文献,或许可以从中发现一些统计方法上的“套路”,例如:单因素+多因素分析、模型调整(model1粗模型、model2...),敏感性分析、亚组分析、森林图等等。

想要全部学完这些方法可不简单,更郁闷的是,也没有充裕的时间来一点点学习。

这时候,你可能学习这套标准化统计分析工具!往下看这个平台都能做什么。

一、平台上都包含哪些分析方法?

目前包含的分析方法有四大模块:

模块一、常规统计分析

基线资料对比、模型调整、亚组分析、轨迹方程、线性回归、敏感性分析、RCS曲线、中介分析、聚类分析等。

模块二、预测模型(Logistic)

基线资料对比、倾向性匹配、ROC、拟合曲线、内外验证、KM曲线、单/多因素分析、LASSO回归、DCA、列线图等。

模块三、Cox生存分析

基线资料对比、倾向性匹配、ROC、拟合曲线、内外验证、KM曲线、单/多因素分析、LASSO回归、DCA、列线图等。

模块四、机器学习

二分类机器学习、SHAP与模型解释、变量重要性图、训练/验证及拆分。

https://dr2pp.oss.ns-svc.cn/qB/qBDW/qBDWTaRXAw1nzA0DDm1S.png

每一种分析方法都已经配置好了,包括图表生成。当我们选择某个统计分析方法时,只需要点选设置,不需要写任何代码,例如模型调整:

https://dr2pp.oss.ns-svc.cn/Jw/Jw1t/Jw1tM3xHavmiVCvZGpqA.jpeg

二、数据从何而来?

平台已经对多个公共数据库的数据进行了清理,从而能够快速用于分析,我们在分析时可以直接选择对应的数据集(已经清理好),如下图:

https://dr2pp.oss.ns-svc.cn/GD/GDc3/GDc3grlZmR0JwtuMpj8F.jpeg

目前包含的公共数据库有:

  • 老龄数据库:CHARLS、LASI、KLoSA、SHARE、HRS、ELSA、MHAS
  • 重症医学:MIMIC、eICU、NWICU、Inspire
  • 健康与营养调查:NHANES
  • 癌症数据库:Seer

特别提醒:同时提供清洗后数据库的下载功能,下载后也可以自己去分析。


找数据、筛变量、清数据、跑分析…… 每一步,本可以更简单。

如果你也正在为找数据、做分析发愁,想让科研更高效——

👇 扫码添加小咖微信,了解更多详情~

https://dr2pp.oss.ns-svc.cn/sh/shxz/shxzWggQRb8c32wEi1B4.pnghttps://dr2pp.oss.ns-svc.cn/LS/LS2Y/LS2YxULxxv6zqRkiNe7O.PNG

小咖4号                                                                                    小咖1号