作者:陈长生,徐勇勇,赵东涛
【关键词】 重复观测
关键词: 重复观测;假设检验;方差分析
摘 要:目的 重复观测数据存在自相关性常导致一元方差分析的误用,探讨一元方差分析两个假定条件的检验. 方法 通过标准正交对比变换克服数据间的自相关性,应用似然比统计量进行假定条件的检验. 结果 给出了重复观测数据一元方差分析的假定条件检验方法,并用软件REP得以实现. 结论 只有满足假定条件,才可以保证重复观测资料单变量方差分析的有效性.
Keywords:repeated measures;hypothesis test;analysis of variance;
Abstract:AIM To explore the tests for two presuppositions concerning the validity of the univariate analysis of variance with repeated measures.METHODS The authors intro-duced orthonormal contrast transformation to avoid auto-cor-relation,and proposed the tests of presuppositions by likeli-hood ratio statistics.RESULTS Hypothesis tests for the presuppositions of the univariate ANOVA with repeated mea-sures were given,and a proper software named REP was im┐plemented.CONCLUSION The validity of the univariate ANOVA with repeated measures will not be ensured unless the presuppositions are satisfied.
0 引言
医学与卫生统计的传统分析方法注重的是数据的独立性,而医学研究中重复观测数据往往具有自相关性,因而重复观测数据的分析有别于一般的统计分析[1-4] .为了克服重复观测数据的自相关性,我们讨论了正交多项式变换的方法,并在此基础上,着重进行了这类数据一元方差分析的假定条件的检验,以便用常规裂区方差分析方法进行统计分析.
1 原理和方法
对于重复观测数据,为了保证一元方差分析的有效性,常有两个假定条件:齐性条件和球对称(sphericity)条件 [5,6] .
1.1 正交多项式变换
值得注意的是,上述假定条件要求的是各组的标准正交对比协方差阵齐性且共同的标准正交对比的协方差阵为σ2 I,I为单位阵.因此,对它们进行假设检验时,一般先要进行数据的正交多项式变换,具体方法步骤见文献[7].
经正交多项式变换后,每一观察单位的p个重复测量数据可转换成(p-1)个新变量T’s(s=1,…,p-1),这(p-1)个新变量的协方差阵就是标准正交对比协方差阵.有了标准正交对比协方差阵SO ,就可进行假定条件的检验.
1.2 齐性条件的检验
检验齐性条件时,检验方法同一般的多组间协方差阵齐性检验.其方法步骤如下[8] :假设k个组,第i组有Ni 个观察单位,每个观察单位有p个重复测量值,即第i组第j个观察单位有如下p个值:Yij =(xij1 ,xij2 ,…,x ijp )’j=1,2,…,Ni ,i=1,2,…,k若Yij 服从正态独立分布Np (μi ,Σi ),则检验假设为H0 :Σ1 =Σ2 =…=Σk ,H1 :Σi 不全相等.
由于经过标准正交对比变换后,原p个数据变量转换为p-1个新变量,故进行标准正交对比协方差阵SO 齐性检验时,重复测量次数p要用p-1来替换,检验假设也要用ΣOi 来代替原来的Σ
如果满足一元方差分析的假定条件,我们就可用熟悉的一元裂区方差分析法来分析重复观测数据资料.
2 实例分析
对20名患者分别给予两种不同的药物,Ⅰ组有患者6名,Ⅱ组有患者14名,对其手术前后的症状进行评分[5] (Tab1).表1 患者症状得分(略)
要判断该资料是否满足假定条件,可先进行正交多项式回归拟合,即Y =Σp-1t=0 A
t Tt (x),Tt (x)=Σt q=0 fx q tq p=6,t=0,1,2,…,5对每一个体都可拟合一正交多项式以得到经标准正交对比变换后的新变量T1’ -T5’ ,这样原始数据就变为相互独立的T
1’ -T5’ ,可以分组求得它们的协方差阵So1 和So2 .
下面可用So1 和So2 来进行假定条件的检验.检验假设:H0 :Σo1 =Σo2 H1 :Σo1 ≠Σo2REP[9] 计算结果,近似χ2 =18.624,ν=15,P=0.2313,不拒绝H0 ,可认为协方差阵齐性,即原始数据的标准正交化协方差阵齐性(即满足齐性条件).由于标准正交化协方差阵齐性,故可进一步作球对称矩阵检验,经REP计算得到检验结果,渐近χ2 =12.8211,υ=14,P=0.5407,不拒绝H0 ,可认为该资料满足球对称条件.
由于满足一元方差分析的假定条件,因此,一元方差分析时,可直接进行常规的裂区方差分析(Tab2).表2 方差分析表(略)
3 讨论
尽管假定条件是针对标准正交对比协方差阵而言,但如果各组原始数据的协方差阵齐性且满足组内相关阵时,可直接进行单变量裂区方差分析.因为对组内相关矩阵作用一个正交对比矩阵可将其转换为球对称矩阵σ2 I,即满足假定条件.但在本文实例中,两组原始数据的协方差阵不齐(近似χ2 =71.3415,υ=21,P≈0.0000),故需进行正交多项式变换.
若假定条件得不到满足,有二个方法可继续进行分析.方法一:进行多元分析(如轮廓分析),其对协方差阵不作要求,但把握度相对来说较低,统计结果不好解释[10-13] .方法二:对一元F统计量进行校正,通过求出球对称系数ε(index of sphericity)以校正分子、分母的自由度,从而获得校正的概率,即进行校正的一元裂区方差分析10,14,15] .
对重复观测数据进行处理时,假定条件未经检验就直接应用常规分析方法常会导致统计分析方法的误用.因为假定条件不满足时所得到的概率P都偏 低,使得差异容易显著,即犯Ⅰ型错误的概率增大,尤其当球对称系数ε较小时,假阳性率将更大.在实际工作中,当ε&<1时,ε对检验的概率P都有一定的影响,ε越小,校正后的概率P比校正前的越大,即校正F界值越大.一般情况下,当求出的F值远远超过或小于F临界值时,可以不进行校正,因为校正后的结论仍将相同,但当求出的F值稍大于不校正F界值时,校正尤其必要,往往会改变原来的结论.如果对资料进行多元分析,此时,多元分析的结论将可能与未校正的一元方差分析的结论不一致.
参考文献
[1]Chen CS,Xu YY,Cao XT.Statistical methods for repeated measures data in medical research [J].Zhongguo Weisheng Tongji(Chin J Health Stat),1996;13(6):55-57.
[2]Chen CS,Xu YY,Wu B.Response feature analysis of longitu-dinal data in medical research [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(1):15-17.
[3]Chen CS,Xu YY,Wu B,Shang L.Multivariate growth curve model of longitudinal data in medical research [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(6):673-675.
[4]Chen CS,Xu YY,Zhang Y,Shang L,Wu B.Growth curve model for comparison of repeated measures data across medical treatment groups [J].Zhongguo Weisheng Tongji(Chi J Prev Med),1998;32(4):245-247.
[5]Crowder MJ,Hand DJ.Analysis of repeated measures [M].London:Chapman and Hall,1990:1-45.
[6]Hearne EM.A test for serial correlation in univariate repeated-measures analysis [J].Biometrics,1983;39:237-240.
[7]Chen CS,Xu YY,Cao XT.Orthogonal regression models for comparison of unequally-spaced repeated measures data across groups [J].Zhongguo Weisheng Tongji(Chin J Health Stat),1996;13(3):1-3.
[8]Srivastava MS,Carter EM.An introduction to applied multi-variate statistics [M].New York:Elsevier,1983:324-346.[9]Chen CS,Xu YY,Cao XT.Implementation of REP and its ap-plication [J].Zhongguo Weisheng Tongji(Chin J Health Stat),1998;15(6):5-7.
[10]Chen CS,Xu YY,Cao XT,Shang L.The adaptation of the uni-variate analysis of variance with repeated measures data of medicine [J].Zhongguo Shuli Yiyaoxue Zazhi(J Math Med),1997;10(3):227-229.
[11]Chen CS,Xu YY,Cao XT,Wu B.A Test for Serial Correlation with Repeated Measures [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),1998;19(5):581-582.
[12]Johnson RA,Wichern DW.Applied multivariatestatistical anal-ysis [M].3rd ed.New York:Prentice-Hall International,Inc.,1992:202-241.
[13]Vonesh EF and Chinchilli VM.Linear and nonlinear models for the analysis of repeated measurements [M].New York:Marcel Dekker,Inc.,1997:11-125.
[14]Follman D.Modelling transitional and joint marginal distribu-tion in repeated categorical data [J].Statistics in Medicine,1994;13(5):467-477.
[15]Diggle PJ,Liang KY and Zeger SL.Analysis of longitudinal data [M].Oxford:Oxford University Press,1994:26-78.