咖主及编辑等各位您好: 在下最近想用机器学习的随机森林算法,R语言做一个某群体

咖主及编辑等各位您好: 在下最近想用机器学习的随机森林算法,R语言做一个某群体发生某病的预测模型。 但是我只有临床基础,对编程也是围观群众。 问题是:1. 用机器学习,对群体纳入人数如何计算?比如需要根据在该群体中发病率的多少计算?两三百个人我也挺尴尬(来自医院病例系统)。只是没有WHO那么好条件,以学习方法为主。 2. 请问用机器学习算法,需要提取的因素例如BMI年龄,是否会比传统研究中更多呢?比如我可以把文化程度也算进来,是不是也可以呢? 2. 上面附加的照片我很感兴趣,请问您在考虑要用热图还是列线图还是评分时,您是基于什么考虑和条件进行选择的? 3. 您以及您的团队做的这个公众号确实不错,实用,不愧北医。但对于一个实际操作的我来说,光看公众号也许还是不太满足,因为做起来真的很细,有无其他学习途径可推荐呢? 谢谢