作者:陈卫, 徐利娜, 迭敏, 刘丽珍, 陈卫中
【摘要】 随着新药临床试验的开展越来越多,也越来越规范,等效性检验、非劣效性检验和优效性检验被广泛地提出,但也常遇到以传统显著性检验代替非劣效、等效和优效性检验的错误。因此,本文从样本均数的抽样分布出发,就它们的适用条件、检验目的、假设形式、公式的区别和联系进行了阐释。
【关键词】 非劣效检验; 等效性检验; 优效性检验; 显著性检验; t检验
【Abstract】 Along with more and more development and standard of clinical trials of new drugs,equivalence,noninferiority test and superiority test are widely introduced.However,wrong replacements of non inferiority,equivalence and superiority tests with traditional significance test are often encountered.Therefore,based on theoretical derivation of the sampling distribution of twosample mean difference,this article explained the applicable conditions,test purposes,hypothesis,and difference and association among the formulas of these three tests.【Key words】 equivalence test; noninferiority test; superiority test; difference test; t test
随着新药临床试验的开展越来越多,试验的设计和统计分析也越来越规范。根据目的不同,临床试验设计可以分为常见的差异性设计、标准阳性对照试验中的等效性和非劣效性设计,以及安慰剂对照试验中的优效性设计,其假设检验方法也随之被广泛地提出。t检验在差异性检验、等效性检验、非劣效性检验和优效性检验中都有应用,虽然其形式不尽相同,但都是t分布在假设检验检验中的应用,因此它们之间既有区别,又有密切的联系。本文将从样本均数的抽样分布出发,讨论差异性检验、等效性检验、非劣效性检验和优效性检验中t检验的区别和联系。
1 样本
均数差的抽样分布[1]设X11、X12、…、X1i、…、X1n1和X21、X22、…、X2j、…、X2n2分别是取自方差相等的总体N(μ1,σ2)和N(μ2,σ2),且相互独立,可分别记作:X1i ~ N(μ1,σ2),i=1,2,…,n1;X2j ~ N(μ2,σ2),j=1,2,…,n2。则其样本均数的抽样分布分别为:
X1~N(μ1,σ2n1),X2~N(μ2,σ2n2)(1)同时根据χ2分布的定义有:
(n1-1)s21σ2~χ2(n1-1),(n2-1)s22σ2~χ2(n2-1)(2) 根据随机变量和的分布定理,样本均数差的分布可记为:
X1-X2~N(μ1-μ2,(1n1+1n2)σ2)(3)对(3)式标准化后有:
u=(X1-X2)-(μ1-μ2)σ1n1+1n2~N(0,1)(4)目前,如果用u作为枢轴量,以样本的信息推断总体均数之间的关系,即总体均数的情况未知时,按照枢轴量只能有一个未知参数的要求,σ就必须已知,此时便是两样本均数的u检验。但一般情况下σ是未知的,故需进一步推导。由式(2),根据χ2分布的可相加性有:
(n1-1)s21+(n2-1)s22σ2~χ2(n1+n2-2)(5)依据t分布的定义:设X~N(0,1),Y~χ2(n),且相互独立,则t=XYn~t(n),带入式(4) (5)可得:
t=(X1-X2)-(μ1-μ2)σ1n1+1n2(n1-1)s21+(n2-1)s22σ2(n1+n2-2)
=(X1-X2)-(μ1-μ2)(n1-1)s21+(n2-1)s22(n1+n2-2)·(1n1+1n2)~t(n1+n2-2)(6)
式中(n1-1)s21+(n2-1)s22(n1+n2-2)为两样本合并方差,常用S2c表示;
(n1-1)s21+(n2-1)s22(n1+n2-2)·(1n1+1n2)为两样本均数差值的标准误,记为SX1-X2。由推导过程不难发现,样本均数差的分布要转换到t分布必须满足3个条件:①样本必须来自正态总体,这里要补充说明一下的是:虽然中心极限定理能保证在样本例数足够大的情况下,不管其是否服从正态,只要是从相同分布的总体中进行的抽样,其样本均数的分布服从如式(1)的正态分布,但不能得到式 (2),故也不能推导出式(6)的结论;②样本之间相互独立;③两组样本对应的总体方差必须相同。
2 t检验
假设检验的实质就是,直接或间接的(基于一定的分布形式)在概率的基础上,依据小概率反证法的原理,完成利用样本信息进行总体之间比较的目的。小概率反证法原理也就意味着在假设检验中,推翻假设(P≤α)更有利于做出正确的结论,因为这时犯错误的可能性是“小概率”,而且这个标准是人为事先设定的,是已知的,而且是可以控制的[2]。因此所检验的目的不同,所提出假设的形式也就不一样。t检验是t分布在假设检验中的应用,就本次讨论的问题而言,就是用成组设计得到的样本信息完成两总体均数之间的比较,根据其分析的目的和设计方法不同,也就出现了常见的差异性检验,标准阳性对照试验中的等效性检验和非劣效性检验,以及安慰剂对照试验中的优效性检验[3,4]。其目的、假设形式和检验统计量如表1所示。表1 各种t检验的目的、假设形式和检验统计量
3 讨论
假设检验的实质就是,直接或间接的(基于一定的分布形式)在概率的基础上,依据小概率反证法的原理,完成利用样本信息进行总体之间比较的目的。t检验也不例外,它是在t分布的基础上进行的一种假设检验,因此无论何种形式的t检验,其应用条件就必须和t分布由来的3个条件一致,即在σ未知的情况下要求资料正态、独立、方差齐[2]。差异性检验和等效性检验、非劣效性检验和优效性检验根本区别在于差异性检验是和0做比较,即两总体均数是否完全不等,而不管这种差别是否有专业意义;等效性检验、非劣效性检验和优效性检验是和Δ做比较,即检验在一定允许范围内的是否相等或不等,不仅要检验差别是否存在,而且更关注这种差别是否具有专业意义。在等效性检验、非劣效性检验和优效性检验中的Δ,即认为在一定范围内相等/等效的允许值,也叫等效临界值,一般认为应从专业角度反复论证并结合成本效益加以估计[2]。根据以往经验[5],较为公认的Δ值如血压可取为0.67 kPa(5 mmHg),胆固醇可取为0.52 mmol/L(20 mg/dl),白细胞可取为0.5×109/(500个/mm3) 等;当Δ难以确定时,可酌取1/5~1/2个标准差,或对照组均数的1/10~1/5等,在生物利用度的等效性评价中,Δ一般取标准参照品均数的1/5,两组率的等效性检验取对照组样本的1/ 10 左右。对于等效检验来说,多采用Schuirmann[6]提出的双向单侧检验的方法(two onesided tests),即分别对下限和上限做两次单侧的t检验。因此,为了保证总体I型错误的发生概率控制在一定水平(常用0.05)以内,是否需要利用Bonferroni方法[7]进行调整还有待进一步的考察和讨论。若需调整,两次单侧检验所得出的P1和P2则需与调整后的α水准进行比较。
参考文献
[1] 刘定远.医药数理统计方法[M].第3版.北京:人民卫生出版社,1999:6267.
[2] 倪宗瓒.医学统计学[M].北京:高等教育出版社,2003:8.
[3] 黄圣凯,韩可勤.生物等效性评价的几种统计方法[J].中国临床药理学杂志,1993,9(1):4346.
[4] 黄钦,赵明.对临床试验统计学假设检验中非劣效、等效和优效性设计的认识[J].药政管理,2007,23(1):6367.
[5] 刘玉秀,杨友春.临床试验疗效的等效性评价[J].中国临床药理学与治疗学杂志,1999,4(3):220223.
[6] Schuirmann DJ.A comparison of the two onesided tests procedure and the power approach for assessing the equivalence of average bioavailability [J].J Pharmacokin Biopharm,1987,15(6):657680.
[7] 姚晨,刘玉秀.临床试验确证疗效时应注意的统计学问题[J].中国循证医学杂志,2005,5(3):245.