独立样本T检验在医学研究中有广泛的应用。它常被用于比较不同治疗方法对患者疾病恢复的影响。例如,在临床试验中,可以使用独立样本T检验来比较新药与常规治疗对患者病情的改善情况。此外,独立样本T检验也可以用于比较不同人群或不同时间点的数据,以评估某个因素对健康指标的影响。 在进行独立样本T检验时,有一些要求需要满足。首先,研究中需要有两个独立的样本组,例如分别从两个不同的治疗组中获取数据。其次,样本的数据应该来自正态分布的总体,这意味着样本数据应该符合正态分布的近似或近似正态分布。最后,两个样本的方差需要大致相等,即两个样本的方差差异较小。 满足这些要求后,我们可以使用独立样本T检验来比较两个样本的平均值是否存在显著差异。通过计算T值,我们可以得出结论,判断差异是否显著,并评估治疗方法对患者疗效的影响。这样的分析有助于为医学研究提供科学依据,优化治疗方案,并改善患者的治疗效果。
编程语言:python
数据来源:选择的R语言自带数据库birthwt,大家可以自己去导出,本次也提供了数据(见附件)
目的:使用Python进行对 birthwt数据 里面 bwt 变量进行独立样本的T检验,比较母亲吸烟对新生儿体重是否有差异
使用的Python库:pandas 、scipy、numpy
前提知识:进行T检验的数据需要先符合正态分布和方差齐性,进行正态性检验的方法见上一篇文章( 用Python进行单样本T检验(附数据) )
导入库:
import numpy as np
import pandas as pd
import scipy.stats as stats
# 读取数据
birthwt = pd.read_csv("F:\\临时项目\\数据处理助手\\birthwt.csv")
# 对数据进行分组
A = birthwt.bwt[birthwt.smoke == 0] # A组:不吸烟组
B = birthwt.bwt[birthwt.smoke == 1] # B组:吸烟组
# 正态性检验
A_result1 = stats.shapiro(A)
B_result1 = stats.shapiro(B)
print("#"*10, f"A组的正态性检验结果:{A_result1}", f"B组的正态性检验结果:{B_result1}", "#"*10, sep="\n")
结果:
##########
A组的正态性检验结果:ShapiroResult(statistic=0.986944317817688, pvalue=0.3336813151836395)
B组的正态性检验结果:ShapiroResult(statistic=0.9829555153846741, pvalue=0.41947314143180847)
##########
根据两个结果可见两组的均为正态数据
# 检验方差是否相等
result2_Bartlett = stats.bartlett(A, B) # Bartlett检验需要数据服从正态性
result2_Levene = stats.levene(A, B) # Levene 检验是非参数检验,不需要考虑数据的正态性
print("#"*10, f"Bartlett检验结果:{result2_Bartlett}", f"Levene检验结果:{result2_Levene}", "#"*10, sep="\n")
##########
Bartlett检验结果:BartlettResult(statistic=1.5069020501083583, pvalue=0.21961241527858236)
Levene检验结果:LeveneResult(statistic=1.456423193277535, pvalue=0.2290244956390305)
结果:两种方法检验的结果都是表明数据是方差齐的,Bartlett (P=0.220) ; Levene(P=0.229)
因此,A、B两组数据均为正态性、方差齐性数据
########### 使用stats类的ttest_ind方法进行独立样本T检验
result3_ttest_ind = stats.ttest_ind(A, B, equal_var=True)
print("#"*10, f"独立样本T检验结果:{result3_ttest_ind}", "#"*10, sep="\n")
参数equal_var 用于设置方差是否相等,本次数据因为上一步方差齐性检验结果是方差齐的,所以这里设置为equal_var=True。
结果:
##########
独立样本T检验结果:Ttest_indResult(statistic=2.652893303213649, pvalue=0.008666726371019078)
##########
结果表明:新生儿体重在吸烟的目前和不吸烟的母亲之间差异具有统计学意义(P=0.009).