Wilcoxon, Friedman...扒一扒非参数检验名称中的牛人

专题合集更多教程

作者:邬娜;审稿:张耀文

 

在很多人看来,参数检验似乎是统计方法的“主流”,而非参数检验往往被当成“非主流”。大家似乎更喜欢用t检验、方差分析这样的参数检验。即使在数据不满足正态分布的条件下,仍然有使用参数检验的执念;总觉得非参数检验不够正式,或者就是不喜欢用。这种对非参数检验的偏见和误解,除了对统计方法的认识不够深入之外,我觉得非参数检验的命名也有一部分责任

 

非参数检验的名称大多都很拗口和难记,更别说能完全拼写正确了。再看看参数检验,比如U检验、t检验,一个字母就搞定了,分分钟记住。让我们仔细看看几个常见的非参数检验的名称,Wilcoxon秩和检验、Mann-Whitney U检验、Wilcoxon符号秩检验、Kruskal-Wallis H检验、Friedman检验,不难发现,这些都是用发明该统计方法的统计学家名字来命名的。我们就来扒一扒这些非参数检验名称中的牛人。

 

Wilcoxon秩和检验、Wilcoxon符号秩检验

 

先开扒Wilcoxon秩和检验、Wilcoxon符号秩检验的发明者——Frank Wilcoxon。他出生于爱尔兰,很小就和父母移民去了美国。青年时期做过水手、管过煤气抽送站、当过树医,25岁获得理学学士学位,毕业后在电力公司工作了3年,又考了化学专业的研究生,29岁时获硕士学位,32岁时获物理化学博士学位。之后在纽约的博伊斯·汤普森植物研究所,担任农作物保护高级研究员。在此期间,他对统计学产生了浓厚的兴趣。1945年,他在研究中发现,进行两组连续变量的组间比较时明明差异很明显,可是用t检验和方差分析就是得不出统计学差异。

 

于是他自己发明了一种统计方法,通过将两组的值排秩次,比较两组的秩次总和即秩和来判断两组是否存在统计学差异,即Wilcoxon秩和检验。他将这个新方法投稿到统计学杂志,只想让统计学家们帮忙看看是否靠谱并修改。没想到当时没有任何一个统计学家考虑到这个问题,于是Frank Wilcoxon发明了该方法,开启了非参数检验的大门。

 

Frank Wilcoxon在1945年同时提出了Wilcoxon符号秩检,用以解决配对资料组间比较的问题。这位大咖兴趣广泛,精力丰富。会包括吉他在内的几种弦乐器,精通英文、荷兰文、俄文、盲文。喜欢骑自行车,经常一天跑160公里。还喜欢爬树,直到七十多岁时摔了一跤,才减少了这方面的活动。

 

Mann-Whitney U检验

 

无独有偶,1947年,奥地利数学家、统计学家Henry Mann和他的学生D.R.Whitney也发明了一种类似的统计方法用以解决这个问题,即Mann-Whitney U检验。比Wilcoxon秩和检验进步之处在于其解决了两组样本量不同的情况下该如何处理,但由于本质上只是Wilcoxon秩和检验的线性变换,因此目前认为Wilcoxon秩和检验等同于Mann-Whitney U检验。

 

Kruskal-Wallis H检验

 

拗口的Kruskal-Wallis H检验,适用于数据不满足正态分布无法使用方差分析时,三组及以上的独立样本的比较,是在1952年由William Kruskal和W. Allen Wallis发明。

 

接下来就开扒来自天才家庭的统计学天才——William Kruskal。他出生于一个纽约的犹太族家庭,妈妈Lillian Rose Vorhaus Kruskal Oppenheimer创立了美国折纸协会,推广儿童折纸游戏。家里有五个孩子,William Kruskal是老大,另外两个弟弟Joseph Kruskal 和Martin Kruskal也都是著名的数学家、统计学家。Kruskal算法、Kruskal重构树等等,好几种方法都用他们的姓氏命名,真是长脸。

 

和他合作发明Kruskal-Wallis H检验的另一位大咖,是W. Allen Wallis。他出生于美国费城。1933年进入芝加哥大学读研究生,在这里结识了之后的著名经济学家、统计学家Milton Friedman,也就是Friedman检验的发明者,开始了一生的友谊。牛人的朋友也都是牛人。之后W. Allen Wallis担任罗切斯特大学校长,更牛的是他先后担任了艾森豪威尔、尼克松、福特、里根四任美国总统的经济学顾问。

 

Friedman检验

 

Friedman检验,是检验三组及以上的相关样本或随机区组设计的组间差异的非参数统计方法,它的发明者则是大名鼎鼎的美国经济学家Milton Friedman。1976年获诺贝尔经济学奖,以表彰他在消费分析、货币供应理论和稳定政策复杂性等范畴的贡献。是芝加哥大学教授、芝加哥经济学派领军人物、货币学派的代表人物。

 

关于非参数检验

 

扒了这么多,这些牛人其实解决的都是一个重要问题,即当数据不满足正态分布时该怎么办。而现实中的很多数据都不服从正态分布,这时候非参数检验的统计学效能要高于参数检验。

 

并且,非参数检验更加稳健。参数统计方法是建立在严格假设条件基础上,一旦假设条件不符合,其推断的正确性就不存在了。非参数检验带有最弱的假设,对模型的限制很少,因而天然的具有稳健性。希望通过这篇文章,大家能对非参数检验有了不一样的认识。

 

扫码关注“医咖会”公众号,及时获取最新统计教程!

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题