作者:李晓妹 刘晓冬 杨晓红 李向云
【摘要】 目的 探讨模拟效果好的数学模型,以拟合围生儿出生缺陷的变化趋势,为卫生部门制定相应的防制对策提供理论依据。 方法 根据我国2001~2006年间围生儿出生缺陷率的变化特点,选用线性函数、幂函数、二次多项式函数对围生儿出生缺陷率变化趋势进行拟合,比较分析各模型的拟合优度及残差等判别指标。 结果 二次多项式模型的拟合效果好于其它2个数学模型,拟合的二次多项式函数为Y=92.8+12.018X-0.554X2。 结论 应用二次多项式模型拟合2001~2006年围生儿出生缺陷率的变化趋势,效果理想。
【关键词】 数学模型;围生儿;出生缺陷率;拟合
【Abstract】 Objective To probe into an effective mathematical model for fitting the prevalence of birth defect among the perinatal infants, so as to provide the theoretical evidence for the department of preventive measures. Methods Based on the national birth defect surveillance data between 2001 and 2006, 3 kinds of mathematical models (Linear model, Power model and Quadratic model) were used to fit the trend of prevalence of birth detect. The models were assessed by comparing the indexes of fitness and residues of the models. Results The Quadratic model was more suitable than the other models. The Quadratic function was: Y=92.8+12.018X-0.551X2. Conclusion The Quadratic model was an effective model in fitting the prevalence of birth defect in Chian from 2001 to 2006.
【Key words】 Mathematical model; Perinatal infants; Birth defects rate; Fitting
近年来,我国围生儿出生缺陷的发生率呈逐年上升趋势[1,2]。出生缺陷不仅影响我国的出生人口素质,也给经济和社会发展也带来沉重的负担[3]。运用数学模型对出生缺陷发生率的变化趋势进行拟合并对未来年份的发生率进行预测十分必要。应用数学模型对某事物的变化趋势进行科学的拟合,可以预测该事物将来的流行趋势,可为卫生部门制定相应的对策和采取积极有效的干预措施提供理论依据,对减少出生缺陷和提高围生儿的出生质量具有重要的现实意义。本文利用2001~2006年的围生儿出生缺陷发生率资料,试用3种数学模型对围生儿出生缺陷发生率进行了拟合,旨在探讨其变化规律。
对象与方法
一、对象
资料来自中国出生缺陷监测中心2001~2006年以医院为基础的出生缺陷发生率监测结果资料[4]。资料为抽取的监测点选择部分县级及县级以上医院和妇幼保健院作为监测医院,在监测医院内住院分娩的孕28周至产后7 d的围生儿(包括活产、死胎、死产)。2003年以后的资料将整个孕期发现的出生缺陷均纳入监测范围,可以对监测地区围生儿中的出生缺陷进行长期、持续的动态观察,与标准基线率进行比较、评估[5]。
二、方法
1.线性曲线拟合:以X=年份-2 000为自变量,以围生儿出生缺陷率Y为因变量绘制(X,Y)的散点图。,根据散点图呈现的2001~2006年间出生缺陷数据的变化趋势,选用线性函数、幂函数、二次多项式函数3种数学模型对出生缺陷数列进行拟合。 ①简单线性拟合。两变量在散点图上呈现直线趋势,一般表达式为Y^=A+BX[6]。利用变量变换的方法,使变换后的两个变量之间呈直线关系。求出直线回归方程后,再将方程中的变量还原为原始数据,得到所求曲线的回归方程[6]。②幂函数曲线拟合。两变量同时取自然对数后变为直线化,即Y1=ln(Y),X1=ln(X),a=ln(A),还原的形式为Y=AXb,即幂函数[7]。③二次多项式拟合。令X1=X,X2=X2,该函数原始数据的表达形式则为Y=b0+b1X+b2X2或Y=b0+b1X1+b2X2,这样,经二次多项式方程转化后可得到多元线性回归方程[7]。
2.模型拟合优度评价:对Y实施变换后,常用的相关指数R2作为曲线回归拟合优度指标不合适[8],本文选用RNL=1-∑(yi-y^i)2∑y2i和FR=∑yiy^i∑y2i∑y^2i作为拟合优度指标来比较幂函数、二次多项式函数的拟合优劣,其中 RNL为 Y和Y^的相关系数,FR为角余弦系数,两指标越接近1,曲线拟合优度越好[9,10]。
3.模型效果评价:对各模型进行残差分析,通过计算和比较累计残差平方和筛选出最优模型。
4.统计学处理:应用SPSS 13.0统计软件包进行线性函数、幂函数、二次多项式函数3种数学模型拟合。
结 果
一、3种数学模型的假设检验
中国出生缺陷监测中心2001~2006年出生缺陷数据的变化趋势的线性函数方程为Y=97.967+8.143 X,幂函数方程为Y=102.507 X0.186;二次多项式函数方程为Y=92.8+12.018 X-0.554 X2。经对3种拟合模型进行方差分析,检验结果发现3种数学模型均能用来表达X与Y的数量变化关系,差异有统计学意义(P&<0.05),见表1。表1 3种数学模型的假设检验结果
二、拟合优度比较
用FR和RNL对幂函数模型和二项式函数模型进行比较,二项式函数的FR和RNL更接近1,且大于其它2个模型,提示用它表达的X与Y的数量关系效果最好。因此,二项式函数优于幂函数和线性函数,见表2。表2 3种数学模型拟合2001~2006年出生缺陷发生率
三、模型效果评价
对3种数学模型进行残差分析,根据表2中出生缺陷率的实际值和估计值,按照公式残差e=实际值-估计值,计算出各模型不同年份的估计残差和累计残差平方和。 2001~2006年间,二项式曲线对围生儿出生缺陷发生率的估计值与实际值之差的波动范围在-3.61~5.92之间,累计残差平方和为60.58;直线方程的估计值与实际值之差在-3.05~7.41之间,累计残差平方和为72.10;幂函数曲线估计的各点围生儿出生缺陷发生率与实际值之差在-5.37~4.12之间,累计残差平方和为76.21。经比较累计残差平方和发现,二项式曲线的估计误差最小,幂函数曲线的估计误差最大。同时,二项式模型比直线函数模型能多解释(72.10-60.58)/5=2.31倍的剩余变异,比幂函数能多解释(76.21-60.58)/5=3.13倍的剩余变异。因此,模拟围生儿出生缺陷发生率变化趋势,二项式曲线模型最为理想,见表3。表3 3种模型拟合围生儿出生缺陷率的残差分析
四、出生缺陷发生率的预测
分别将X=年份-2 000代入二项式函数,可运用该模型预测未来年份的出生缺陷发生率,由此求得的中国2007~2008年围生儿出生缺陷发生率分别为149.78/万和153.49/万。
讨 论
出生缺陷的发生关系到一个国家的人口素质和社会可持续发展。通过本文数据分析可知,我国围生儿出生缺陷发生率总体上呈现逐年上升趋势,这对卫生保健工作提出了更高的要求。为此,我国在防治出生缺陷方面投入了大量的人力、物力和财力,虽然在出生缺陷的类型及其发生率的顺位情况、出生缺陷的影响因素及其治疗措施等方面做了较多的研究。出生缺陷的预防性研究,尤其是将数学模型应用于出生缺陷发生率的预测十分必要,且局限于应用单一的直线回归模型对出生缺陷发生率进行预测,如周凤荣等[11]根据围生儿出生缺陷的发生率,以时间为自变量进行了直线回归分析,并对未来几年的出生缺陷发生率的变化趋势进行了预测。近些年来,由于出生缺陷的发生受多种因素影响,其变化趋势并未呈现明显的线性特征,而更多地具有曲线特征。因此,探讨适宜的数学模型对出生缺陷的发生状况进行预测,对于卫生管理工作者和妇幼卫生人员积极开展预防措施、有效预防和减少出生缺陷的发生和提高我国出生人口的素质具有重要的现实指导意义。
为探讨合适的数学模型模拟我国2001~2006年间围生儿出生缺陷率变化趋势,本文先根据散点图呈现的变化趋势特点,选用直线函数、幂函数和二次多项式函数三种数学模型对围生儿出生缺陷率进行拟合,然后通过比较拟合度指标和残差分析结果,筛选出拟合效果较理想的二次多项式曲线模型。通过二项式模型预测的2007年和2008年的围生儿出生缺陷率分别为149.78/万和153.49/万,预测结果显示我国的围生儿出生缺陷率呈上升趋势,提示有关部门应尽快采取相应对策,如倡导孕前保健,加强优生优育宣传教育等措施,不断降低围生儿出生缺陷发生率,提高新生儿出生质量。此外,数学模型主要是从数据上反映疾病发生的变化规律,不能反映非规律性的因素对预测结果的影响,在应用中应注意密切结合实际。
参考文献
1钟南.浅谈我国出生缺陷研究的现况与展望[J].中国优生优育,2007,13(1):10-11.
2李雪丹,郭晓玲,刘丹,等.近五年出生缺陷的变化趋势[J].中国优生与遗传杂志,2007,15(3):10-12.
3周进.加强围产保健 降低出生缺陷的发生[J].中华现代妇产科学杂志,2005,2(8):766-767.
4江帆.国家人口计生委出生缺陷一级预防工作会议报告[C]. 2007.
5黄越华.中国出生缺陷监测的现状[J].广西医学,2006,28(11):1745-1747.
6方积乾,孙振球,主编.卫生统计学 [M].第5版.北京:人民卫生出版社,2003. 223-224.
7胡良平,主编.现代统计学与SAS应用[M].北京:军事医学科学出版社,2000.235-240.
8王培承,宋春燕,胡式良,等.应用曲线拟合对乙脑发病率进行分析预测[J].中国医院统计,2004,11(2):106-107.
9徐勇勇,陈常生,张成岗.曲线拟合中的几个问题[J].中国卫生统计,1994,11(2):58-60.
10张世强.曲线回归的拟合优度指标的探讨[J].中国卫生统计,2002,19(1):9-11.
11周凤荣,张蓬,陈志欣,等.围生儿出生缺陷发生及趋势预测分析[J].中国公共卫生,2005,21(10):1164.