横断面研究的分析流程
您好,请问单因素/多因素分析是仅指相关分析之类的么?
横断面数据,需要看如题的年龄、性别、血压、血糖、生化指标、疾病严重程度等众多指标与DNA量(因变量)的相关性。
统计目的:① 看一些关注的因素(如血糖)在不同分组时DNA有无差别;②找出与DNA量相关的因素。
本人提到的“分组”是指比如每个指标会有自己的划分指标,如血糖分正常、偏高、高,年龄有青年、中年、老年等。
现在DNA非正态分布,目前不清楚的点,最主要是:【 这一大批数据的分析流程】
1. 请问是先非参数检验、再相关回归分析;还是先相关和回归,再选择有相关性的因素进行分组非参数检验?
——例:
思路①先仅按血糖分正常、偏高、高,非参数检验,对比组间DNA量有无显著差异→再仅按其他某一因素进行分组,非参数检验→按研究的因素依次进行单因素相关分析→多因素相关、回归分析
思路②先按研究的因素依次进行单因素相关分析→多因素相关、回归分析→选出回归分析纳入的变量→若未纳入,不进行非参数检验;若纳入,例如血压、血糖纳入,则分别按血压、血糖进行分组,非参数检验,看不同血压或不同血糖之间有无显著差异
以上思路哪种正确呢?
2. 如何看变量的交互作用
3. 若仅按某一元素(如血糖)分组,进行非参数检验,看DNA量有无显著差异。分组后是否需要看除血糖外其它因素(如年龄、血压、BMI等)的可比性?若可比还好,但是若其中其它指标中有一些有显著差异,那非参数检验的结果还可信么?