【摘要】 目的 探索利用Excel统计函数进行t检验。方法 将计数资料的t检验分为有原始数据和没有原始数据的t检验,分别建立格式化的电子表格,利用Excel统计函数TEST、TINV、FTEST进行t检验运算。结果 利用Excel统计函数可快速计算出t检验值和t0.05值,无需再查t分布的双侧分位数表。结论 t检验值计算结果可靠,简单易学。
【关键词】 Excel;统计函数;t检验
在医药科研论文中,常用到t检验,其目的在于帮助决策者基于小样本事件对总体作出二择一决策〔1,2〕。在没有SAS和SPSS等统计分析软件包时,单凭手工计算,费时费力,结果还不一定可靠。现在利用Excel统计函数功就可以方便实现t检验。此法具有简单易学、结果可靠、成本低廉、易于推广的优点。
1 资料与方法
1.1 工作平台
主频200 MHz以上CPU ,64 M内存, 1.2 G以上硬盘。Window 98/2000/XP操作系统,Excel 2000或以上版本。
1.2 随机化配对设计资料均数的t检验
1.2.1 资料
例1:12个志愿者服用某减肥药,服药前后体重数据见图1,判断此减肥药是否有效。
1.2.2 方法
单击C3单元格,点击“插入”菜单下的“fx函数”,打开黏贴函数对话框,在“函数分类”项下选“统计”,在“函数名”项下选“TTEST”,单击“确定”。打开TTEST对话框,在Array1栏输入“B1:M1”,在Array2栏输入“B2:M2”,Tails栏输入“2”,Type栏输入“1”,按“确定”,在C3单元格显示概率P值为“0.57”(保留小数后两位),此时就可以得出此减肥药效果为零的结论;用P值可反过来求t值,单击E3单元格,其余同前,只在“函数名”项下选“TINV”,在Probability栏中输入“C3”,在Deg_freedom栏中输入自由度“11”,在F3单元格显示t为“0.58” (保留小数后两位)。利用TINV函数,求出在显著性水平α=0.05,自由度为11时临界值t0.05=2.20,t<t0.05,这与P=0.57>0.05结果一致,结论与教材上一致〔1〕。
1.2.3 数据分析
选择菜单“工具”项下的“数据分析”,选择“t检验:平均值成对二样本分析”,按确定,变量1的区域输入“$B$1:$M$1”,变量2的区域输入“$B$2:$M$2”, α=0.05,输出选项,可以不选,直接按确定,输出如图1。
1.3 两组完全随机化设计资料均数的t检验
1.3.1 资料
例2:某克山病区测定11名克山病患者与13名健康人的白磷值(mmol/L)如图2,检验患者与健康者白磷均值是否不同。
1.3.2 方法
1.3.2.1 F检验
两组完全随机化设计资料均数的t检验,要根据两组方差是否齐性而采取不同的Type值,方差齐性选Type2,方差不齐性选Type3,故要先进行方差齐性的F检验。方法:基本操作同前,只在“函数名”项下选“FTEST”,单击“确定”。打开FTEST对话框,在Array1栏输入“B1:L1”,在Array2栏输入“B2:N2”,按“确定”,在B3单元格显示概率P值。P>0.05,因此方差齐性;若P<0.05,则方差不齐。
1.3.2.2 t检
单击D3单元格,打开TTEST对话框,在Array1栏输入“B1:L1”,在Array2栏输入“B2:N2”,Tails栏输入“2”,Type栏输入“2”,按“确定”,在D3单元格显示概率P值。用P值可反过来求t值,单击F3单元格,打开TINV对话框,在Probability栏中输入“D3”,在Deg_freedom栏中输入自由度“22”,在F3单元格显示t。利用TINV函数,求出在显著性水平α=0.05,自由度为22时临界值t0.05=2.07,t>t0.05,这与P<0.05结果一致,也与教材结果一致〔2〕。
1.4 科研论文中的t检验初步验证
在科研论文中常常碰到t检验问题,需要进行验证。如果文献提供了均数、标准差和分组情况,虽然没有原始数据,也可按如下方法进行简单验证。
1.4.1 两组完全随机化设计资料均数的t检验
例3:男女红细胞计数(×1012/L)样本均数、样本标准差和样本量分别对应于图3中实验组和对照组,试判断男女红细胞计数的总体均数是否相等。此法适用于方差齐性。在B4中输入“=(C2C3)/SQRT((((B21)*D2*D2+ (B31)*D3*D3)/(B2+B32))*(1/B2+1/B3))”求t,在B5中输入“=TINV(0.05,B2+B32)”求t0.05。利用t值求P值,在D4中输入“=TDIST(B4,B2+B32,2)”求P。结论:由于t>t0.05,故认为两组均数不等,这与P值一致。
例4:随机抽取10名病人和20名健康人,分别测定某生化指标,其样本量、样本均数和样本标准差分别见图4中实验组和对照组,试判断总体均数是否相等。
按图4在B11中输入“=(C9C10)/SQRT(D9*D9/B9+D10*D10/B10)”求t,在B12中输入“=(D9*D9*TINV(0.05,B91)/B9+D10*D10*TINV(0.05,B101)/B10)/(D9*D9/B9+D10*D10/B10)”求校正后的t0.05,在D11中输入“=TDIST(B11,B9+B102,2)”,求P值。由于方差不齐,故出现了P与t值矛盾的结论,此时由于对t0.05进行了校正,故应按t值进行判断。结论:认为两组均数相等,无显著性差异。
1.4.2 单组完全随机化设计资料均数的t检验
例5:大量调查表明健康成年男子脉搏的均数为72次/min,某医生在一山区抽样调查了25名健康成年男子,其脉搏均数和标准差见图5中实验组,能否判断山区健康成年男子脉搏与常人有差异。按图5,在B20中输入“=(C18C19)/(D18/SQRT(B18))”求t值,在B21中输入“=TINV(0.05,B181)”求t0.05。在D20中输入“=TDIST(B20,B181,2)”求P。结论:认为两组均数不等,有显著性差异。
1.4.3 随机化配对设计资料均数的t检验
若实验数据为配对资料(如例1),可求配对处理前与处理后差值的均数及标准差。如例1,其样本量、差值均数和差值标准差分别为12、1.33、7.91,按图5录入实验组,但此时对照组均数为“0”,按2.3.2项下操作,可一步得到结果。
2 讨 论
在t检验统计对话框中涉及以下参数:Array1和Array2分别代表第一组数据和第二组数据,Tails代表分布尾,单尾取1,代表单侧检验,双尾取2,代表双侧检验。同一批数据作单侧检验,其P值减半,倾向于拒绝H0,会增加犯第Ⅰ类错误的机会,因此应少作单侧检验。只有根据专业知识和常识有充分理由排除某一侧,即认为某一侧是不可能发生的事情,才进行单侧检验。Type代表t检验的类型,1代表配对检验,2代表双样本等方差假设,3代表双样本异方差假设。Probability代表概率,Deg_freedom代表自由度。如为单组前后对照,则自由度为参与者减1;如为双样本对照,则为参与者减2。在无原始数据时t检验验证中,可根据方差数值差异初步判断方差类型。
Excel具有强大的统计处理功能,利用以上操作可以得出简单的二择一结论。在建立了多种形式的t检验表后,如图3~图5,需要对工作表进行保护〔3〕,除了数据录入区域外,使其他区域处于保护状态,将电子表以模板形式保存,日后只需要修改录入区数据,既可一步得到检验结果。当然,要想一次得到更为详细的结论,如平均值、方差、单尾临界值、双尾临界值等,要选择菜单“工具”项下的“数据分析”,如“工具”项下无“数据分析”,则要选择加载宏,在对话框中指定加载分析工具库。若结合VBA编辑器进行简单编程,可得到个性化的专业统计软件。
参考文献
1 徐秉玖.药物统计学〔M〕.北京:北京医科大学出版社,1999:228.
2 方积乾.医学统计学与电脑实验〔M〕.上海:上海科技技术出版社,1997:86.
3 袁 进,赵树进.Excel软件统计函数在医药资料设计χ2检验中的应用〔J〕.中国药房,2006;17(20):1595.