新疆地区7个少数民族遗传分化及基因流动特征

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw2023125676 日期:2026-01-05 来源:论文网

【摘要】 目的 基于9个CODIS STR位点分型数据,探寻新疆地区7个主要少数民族的遗传分化及基因流动特征。方法 计算杂合度、Nei遗传分化系数、Nei遗传距离以及Wright F统计量,使用确切概率法对民族分化水平进行统计检验;通过Mega构建系统发生树,Arlequin进行分子方差分析;应用R矩阵模型分析基因流动形式。结果 7个少数民族平均杂合度均大于0.7,遗传分化系数小于2%,群体分化检验显示多数位点都有显著性差异;系统发生树和分子方差分析表明7个民族分为三支;R矩阵分析结果显示维吾尔、柯尔克孜以及乌兹别克族具有较高的基因流动水平,而回族基因流动形式呈现一定隔离性。结论 新疆7个少数民族属于独立民族,但分化程度一般;其进化关系上较近,存在广泛的基因交流。

【关键词】 STR;新疆地区群体;遗传分化;基因流动;系统发生树;分子方差分析;R矩阵;语系
  
  ABSTRACT: Objective Genotype data of nine CODIS STR loci were gathered to examine the features of population differentiation and gene flow of seven Xinjiang minorities. Methods Heterozygosity, Neis coefficient of genetic differentiation, Neis genetic distance and Wrights Fstatistics were calculated. Statistical tests using exact method were performed to measure the level of differentiation. Phylogenetic trees were constructed by Mega; AMOVA was processed by Arlequin. Rmatrix model had been applied to describe the patterns of gene flow. Results It shows that average genetic heterogeneity for each population was above 0.7 with genetic differentiation coefficient below 2%. Statistical tests for population differentiation were significant for most of the loci. Phylogenetic analysis and AMOVA showed that all populations were pided into three main groups. The Rmatrix analysis reflected that Uygur, Kirgiz and Ozbek had more amounts of gene flow than other populations, while the pattern of Hui was more isolated. Conclusion The seven minorities in Xinjiang are independent populations, while the level of differentiation is at average. The relationship in evolution is not far from each other, with wide gene flow.

  KEY WORDS: STR; Xinjiang population; genetic differentiation; gene flow; phylogenetic tree; AMOVA; Rmatrix; language family

  新疆维吾尔族自治区作为中国最大的省份,覆盖将近1/6的国土面积。世居新疆的少数民族有12个,即维吾尔、回、哈萨克、柯尔克孜、塔吉克、乌兹别克、塔塔尔、锡伯、蒙古、俄罗斯、满及达斡尔[1]。自上世纪90年代以后,STR标记被广泛地运用于连锁作图、法医鉴定或识别、群体遗传学分析及基因检测或诊断等[25]。本实验室前期研究中,对于法医学领域应用的9个CODIS位点(包括CSF1PO、FGA、TH01、TPOX、VWA、D3S1358、D5S818、D7S820和D13S317),新疆各少数民族中都显示高度多态性,法医学应用价值较高[68]。因此,本文以实验室前期数据为基础,利用多种统计遗传学方法,对新疆地区7个少数民族的遗传分化特征及基因流动形式进行分析,从而用动态的观点解释该地区的民族进化或起源关系。

  1 材料与方法

  1.1 材料收集 每个民族样本量不少于100,并且采用全自动基因扫描技术对样本进行STR基因分型。整理王新淮等在不同文献中报道过的新疆各民族、各位点的基因频率或基因型频率数据[56],并对实验室保留的原始基因分型数据进行搜集和整理,最终得到完整的不同民族各位点的基因型频数和等位基因频率。7个不同少数民族的样本描述见表1。

  表1 各少数民族名称、样本量、位置及语系特征(略)

  Table 1 Population name, sample size, location, and linguistic affiliation of the minorities

  1.2 方法 期望杂合度及各位点平均杂合度的计算通过程序NJBAFD实现。应用软件Genepop3.4,使用基于概率的确切检验法,对各位点基因型分布是否符合HardyWeinberg(HW)平衡进行检验;同时采用隐马尔科夫链模型(参数设定为默认值),衡量群体间分化程度[9]。Wright提出的F统计参数(包括F、θ、f),可用来衡量群体内部及群体之间的遗传变异程度;其指标的计算及显著性水平都是通过软件Fstat2.9.3实现。另外,结合公式Gst=(HsHt)/Ht,计算得到各位点的遗传分化系数Gst[10]。
  
  Nei提出的DA距离以及Wright提出的Fst指标,都是基于等位基因频率的遗传距离测度,受样本量大小、微卫星进化模型及群体进化模式等因素影响较小[11];可分别用phylip3.6程序包和Arlequin3.0软件计算得到。基于两种遗传距离,通过Mega2.1构建NJ系统发生树。不同分组方法的分子方差分析由Arlequin3.0软件实现。应用Harpending及Ward(1982)的R矩阵模型[12],可计算得到各民族间的R矩阵系数;并采用SPSS13.0绘制平均杂合度和rii系数的回归图。

  2 结果

  2.1 各民族多态性 各民族样本的HW平衡检验中,采取Bonferronii修正法,将显著性P值设为0.0056(0.05/9),其结果显示7个少数民族对应的9位点标记绝大多数都满足HW平衡。各民族在不同位点的期望杂合度及总体平均杂合度水平见表2。所有民族中大多数位点期望杂合度都大于0.7,其中多态性较高的位点是FGA(0.825-0.864),多态性较低的位点是TPOX(0.609-0.691)。9位点标记系统显示各民族的平均杂合度大于0.7, 显示较高的多态性,可用于研究群体分化及进化。

  2.2 民族间分化水平 确切检验结果及各群体分化指标值见表3。除了位点D5S818,所有位点的群体分化检验都呈显著性。与此同时,衡量群体间分化的固定指数θ在绝大多数位点都呈显著性(CSF1PO、D13S317除外),而衡量群体内部分化的固定指数f及F则显示没有显著性意义。Nei提出的遗传分化系数Gst值在各位点的分布为0.003-0.015,其总体平均值为0.008。

  表2 9位点STR标记系统各位点期望杂合度及各民族平均杂合度(略)

  Table 2 Expected heterozygosity by locus and average heterozygosity of the total population

  表3 各位点群体分化的确切概率检验及分化指标(包括F, θ, f和 Gst)(略)

  Table 3 Exact test and parameters (F,θ, f and Gst) of population differentiation at each locus

  S: standard error; significant values of exact probabilities according to Bonferronis criterion (critical P value=0.05/9) are in bold type.

  *P<0.05

  2.3 系统进化分析 基于两种遗传距离测度构建的系统发生树,拓扑结构完全一致。首先7个民族划分为主要的2支,第一支为维吾尔族和回族,第二支为其他5个民族。其次,根据进化树的分支结构,第二支的5个民族又可以区分为2亚类,第一亚类为蒙古族和锡伯族,而第二类为哈萨克族、柯尔克孜族及乌兹别克族(图1)。

  图1 通过Nei氏遗传距离DA构造的系统发生树(左)及通过Wright的Fst固定指数构造的系统发生树(右)(略)

  Fig.1 NJ phylogenetic trees constructed from Neis DA distance (left) and Wrights Fst distance (right)

  2.4 分子方差分析 不同分组方式的方差变异贡献率显示,绝大部分遗传变异来源于各民族群体内部之间,而仅有某种特定的分组方式才会产生具有统计学意义组间差异。表4是不同分组方式的分子方差分析结果。Fst值衡量所有群体之间的差异大小,Fsc值可以衡量组内不同群体之间的差异大小,Fct值衡量不同组间的差异大小[9];结果显示分组法2和分组法4能产生显著性的Fct值,代表这两种分组方式导致的组间差异具有统计学意义。

  2.5 R矩阵分析 Harpending & Ward(1982)提出的R矩阵模型,可应用于短串联重复序列数据,从而研究某一地区或某一语系大群体内部各亚群体间的基因流动形式,观测群体间的融合和可能的随机过程的效应[13]。表5中是根据该模型提出的数学公式计算得到的R系数矩阵,可以发现,民族亲缘关系越接近,相互间的R矩阵系数越大,更明显的是,每行中各民族与本身的R系数最大。其次,对于对角线上的R矩阵元素Rii以及9个STR位点计算得到的平均杂合度,其回归分析结果显示,回族处于期望回归直线的下方,而且偏离较远;蒙古族、哈萨克族及锡伯族处于期望回归直线的两侧,很接近回归直线;柯尔克孜族、维吾尔族和乌兹别克族处于回归直线上方,而且偏离较远(图2)。

  表4 基于不同分组方法的分子方差分析(略)

  Table 4 AMOVA results of different grouping methods

  Method 1: 2 groups from linguistic, as Altaic and NonAltaic; Method 2: 3 groups from linguistic, as Altaic phylum, Turkic family, Altaic phylum but other family and NonAltaic phylum; Method 3: 2 groups from phylogenetic trees; Method 4: 3 groups from phylogenetic trees.

  *P<0.01; ns: nonsignificant

  表5 7个少数民族间的R矩阵系数(略)

  Table 5 R matrix values between the seven populations

  The diagonal elements of the matrix are in bold, named as Rii value

  图2 Rii系数相对于平均杂合度的回归分析图(略)

  Fig.2 Regression plot of meanperlocus heterozygosity versus the Rii values

  3 讨论

  3.1 民族样本代表性 据第五次人口普查数据统计,新疆地区维吾尔族和哈萨克族人口均超过100万,柯尔克孜族人口超过10万,而锡伯族和乌兹别克族人口小于10万;而对于生活在新疆的回族和蒙古族,人口数分别在50万或10万以上。由于新疆地区的回族和蒙古族大多数是通过13世纪以后的大规模人口迁移[14],如从内蒙古地区或宁夏地区;而且民族基因特征的改变需要经历较长的时间,同时为了节省采样过程花费的时间和经费,本文以宁夏地区的回族和内蒙古地区的蒙古族代表新疆地区生活的回族和蒙古族。对于采集的民族样本,必须满足三代以上个体均为同一民族的条件,而且遵循随机抽样原则。

  3.2 地理、语系及民族风俗 新疆地理环境中,天山扮演着举足轻重的角色,其将新疆分为北疆和南疆地区。北疆气温较低,多山地,降雨量较多,人民多以游牧为生;而南疆气温高,多平原沙漠,干旱而降雨量少,人民多以农业为生[15]。维吾尔族和柯尔克孜族主要分布于南疆地区,而哈萨克族、乌兹别克族则主要分布于北疆地区。7个民族语言各异,但从语系角度讲,其大致分为两类,除回族属于汉藏语系,通用汉语之外,其他民族都属于阿尔泰语系。而宗教方面,多数属于伊斯兰教,如维吾尔族、回族、柯尔克孜族、哈萨克族和乌兹别克族,而锡伯族和蒙古族没有特定的宗教信仰。CavalliSforza先生曾指出,在不同人群的进化及基因交流中,地理、语系、宗教及人口都起着非常重要的作用[16]。新疆地区的7个民族,以天山为地理隔离,语系隶属2大种类,宗教亦分属于不同类型,这些都对民族间的婚配、迁移及基因造成了一定的影响。

  3.3 民族分化特征 以9个法医学CODIS位点的遗传数据为基础, 通过统计检验及多种统计遗传分析方法,结果显示新疆7个民族之间确实存在着遗传异质性,都具有独立群体的特征。系统发生树及分子方差分析显示7个民族在进化上分为3个不同分支,而且这种遗传学上的分支与根据语系特点的分类具有较高的关联性。但是,遗传分化系数却小于2%,显示这些民族间的分化程度一般[13],说明其起源上可能具有同一祖先或者在民族演化过程中存在着相互之间的基因流动。

  3.4 民族融合特征 R矩阵模型由Harpending以及Ward于1982年提出,主要是通过分析大群体内各亚群体等位基因频率的结构特点,从而从分子角度对亚群体间的基因流动进行考察。印度学者Reddy等人成功将该方法应用于印度不同部落群体间的基因流动形式的研究[17]。本文首次将该方法应用于中华民族群体基因流动特征的分析。其结果显示,新疆7个民族中,回族群体处于较为隔离的状态,而维吾尔族、柯尔克孜族和乌兹别克族的基因交流较为广泛。这些结果与这些民族的历史学、考古学方面的研究是基本一致的。值得提出的是,R矩阵模型比较适宜于分析特定地区或特定语系范围内的亚群体间的融合特征,而对于地理位置较远、表型特征相差较大的群体,则不宜使用[17]。

参考文献


  [1]童玉芬,李建新. 新疆各民族人口的空间分布格局及变动研究 [J]. 西北民族研究, 2001, 3:1120.

  [2]Colette D. A comprehensive genetic map of human genome based on 5264 microsatellites [J]. Nature, 1996, 380(2378):1417.

  [3]宋土生,黄辰,司履生,等. 应用网络STR生物信息对中国14个人群遗传距离的研究 [J]. 西安交通大学学报(医学版), 2003, 24(1):14.

  [4]Goltsov AA, Eisensmith RC, Naughton ER, et al. A single polymorphic STR system in the human phenylalanine hydroxylase gene permits rapid prenatal diagnosis and carrier screening for phenylketomuria [J]. Hum Mol Genet, 1993, 2(2):577582.

  [5]袁东亚,康龙丽,赵健民,等. 西藏珞巴族15个STR位点遗传多态性研究 [J]. 西安交通大学学报(医学版), 2006, 27(4):319324.

  [6]王新淮,高树辉,赖江华,等. 新疆4个民族STR基因座遗传多态性研究 [J]. 遗传学报, 2002, 29(9):761767.

  [7]Wang Xinhuai, Gao Shuhui, Lai Jianghua, et al. STR data for the AmpFLSTR ProfilerTM loci from Sinkiang (NW China) [J]. Forensic Sci Int, 2002, 129:214215.

  [8]王新淮. 新疆维吾尔自治区5个少数民族基因组遗传多样性及群体遗传结构研究 [D]. 西安:西安交通大学博士学位论文, 2002.

  [9]Iriondo M, Barbero MC, Manzano C. DNA polymorphisms detect ancient barriers to gene flow in Basques [J]. Am J Phys Anthropol, 2003, 122(1):7384.

  [10]顾万春. 统计遗传学 [M]. 北京:科学出版社, 2004:56150.

  [11]Takezaki N, Nei M. Genetic distances and reconstruction of phylogenetic trees from microsatellite DNA [J]. Genetics, 1996(144):389399.

  [12]Harpending HC, Ward R. Biochemical aspects of evolutionary biology [M]. Chicago: University of Chicago Press, 1982:201400.

  [13]Dutta R, Reddy BM, Chattopadhyay P, et al. Patterns of genetic persity at the nine forensically approved STR loci in the Indian populations [J]. Hum Biol, 2002, 74(1):3349.

  [14]娜拉. 清末民国时期新疆游牧社会研究 [D]. 兰州:兰州大学博士学位论文, 2006.

  [15]贺萍. 西部大开发与新疆多元民族文化关系研究 [D]. 西安:西北大学博士学位论文, 2005.

  [16]Cavalli SLL, Feldman MW. The application of molecular genetic approaches to the study of human evolution [J]. Nat Genet, 2003(33):266275.

  [17]Reddy BM. Rmatrix analysis and patterns of gene flow in India [J]. Hum Biol, 2001, 73(1):5769.

如果您有论文相关需求,可以通过下面的方式联系我们
客服微信:371975100
QQ 909091757 微信 371975100