SPSS详细操作:正态转换的多种方法
龚志忠

龚志忠

首都医科大学附属北京中医医院

擅长:临床研究数据统计分析、流行病学方法设计、临床预测模型建模与评价
已关注
关注
2019-04-08 来源:医咖会

在上一期的内容中,我们介绍了如何利用偏度值、峰度值、直方图、P-P图(Q-Q图)以及非参数检验的方法来对数据资料进行正态性检验。详见:SPSS教程:判断数据正态分布的超多方法!

当数据分布呈现非正态时,我们可以将原始数据作某种函数的转换,使偏态资料正态化,从而满足T检验或其他统计分析方法对资料的要求,这一节内容我们将向大家介绍如何对数据资料进行正态转换。

一、正偏态分布资料

1、轻度正偏态分布

偏度值>0,偏度值为其标准误差的2-3倍,即Z-score=2~3,此时认为资料分布呈现轻度的正偏态分布,可以考虑对变量x取根号开平方的方法来进行转换。

SPSS语句如下:

COMPUTE x_new = SQRT(x)

(SQRT为开平方根Square Root缩写)

2、中度正偏态分布

偏度值>0,偏度值为其标准误差的3倍以上,即Z-score>3,此时认为资料分布呈现中度的正偏态分布,可以考虑对变量x取对数来进行转换。可以取自然对数(ln)或以10为底的对数(log10)。

SPSS语句如下:

COMPUTE x_new = LN(x)

COMPUTE x_new = LG10(x) 

注意LG10的纠正力度较强,有时甚至会矫枉过正,将正偏态转换为负偏态,因此在进行正态转换后一定要对该变量再次进行正态性检验

3、重度正偏态分布

对于两端波动比较大的数据资料,极端值可能产生较大的影响,此时可以考虑取倒数的方法来进行转换。

SPSS语句如下:

COMPUTE x_new = 1/x

注意根号下要求数据均为非负数(即≥0),对数要求数据均为正数(即>0),取倒数要求分母不为0, 如果变量x中出现上述情况,则需要先将其进行一定的转换,如x+K或K-x,再对其取根号、对数或倒数。其中K为一个常数,可以根据需要进行赋值,例如赋值为1,或取数据的最小值、最大值等。