作者:高树辉,桂宏胜,李生斌
【摘要】 目的 观察中国云南怒族群体线粒体DNA D环高变区Ⅱ(HVRⅡ)单核苷酸多态性(single nucleotide polymorphism, SNP)的群体遗传特点,为法医学鉴定提供线粒体DNA序列多态性的基础数据。方法 应用ABI3730型遗传分析仪,PCR产物直接测序法,对65名中国云南怒族无关个体血液中利用chelex100法提取的线粒体DNA D环高变区Ⅱ进行序列分析。结果 在线粒体DNA高变区Ⅱ(HVRⅡ)73~366之间与Anderson序列比较,云南怒族65名无关个体共发现有59个单倍型,401个突变点。SNP基因差异度为0.9957,核苷酸多态性为0.1174。结论 云南怒族线粒体DNA D环区HVRⅡSNP具有高度多态性,是对怒族群体的个体识别、亲权鉴定以及民族起源分子研究有用的遗传标记。
【关键词】 怒族群体 HVRⅡ 线粒体单核苷酸多态性 个体识别
ABSTRACT: Objective To investigate the mitochondrial DNA Dloop region HVRⅡsingle nucleotide polymorphism (SNP) of Nu ethnic population from Yunnan Province of China and to provide basic database of mtDNA sequence polymorphism for forensic identification purpose. Methods Genomic DNA from the whole blood of 65 unrelated inpiduals from Nu ethnic population living in Yunnan Province of China was extracted by standard chelex100.The sequence polymorphism was analyzed by PCRbased assay with ABI 3730 Analyzer to detect the number of relatively common point mutations. Results We compared the mtDNA HVRⅡ 73~366 with the Anderson sequence; 59 SNP loci were observed among them with 401 point mutations identified in mtDNA of 65 inpidual Nu ethnic population. The genetic persity was estimated to be 0.9957, and the random match probability was calculated to be 0.1174. Conclusion The result suggests that mtDNA HVRⅡ SNP database of Nu ethnic population can be an useful tool for forensic inpidual identification, paternity test and national origin research.
KEY WORDS: Nu ethnic population; HVRⅡ; mitochondrial single nucleotide polymorphism; inpidual identification
人类线粒体DNA(mitochondrial DNA, mtDNA)是一个双链环状的DNA分子,共含有16569个碱基[1],是唯一的细胞核外DNA。线粒体DNA有一个非编码区,称为控制区(control region),也称D环区(Dloop region)。D环区大约有1100bp的碱基,其中包括两个高变区(HVRⅠ和HVRⅡ),高变区Ⅰ的范围大约在16024~16365间,高变区Ⅱ的范围约在73~340间。在两个高变区间,线粒体DNA存在着高度序列多态性,作为遗传标记已被广泛应用于法医学个体识别和亲权鉴定。本研究以云南怒族群体线粒体DNA D环区HVRⅡ为研究对象,观察怒族线粒体DNA单核苷酸多态性(single nucleotide polymorphism, SNP)的群体遗传特点,为法医学鉴定提供线粒体DNA序列多态性的基础数据。
1 对象与方法
1.1 样本
云南怒族65名无血缘关系健康个体静脉血,每份3mL,EDTA抗凝,-70℃保存。
1.2 方法
1.2.1 线粒体DNA提取
Chelex100法提取DNA。
1.2.2 线粒体DNA扩增与纯化
线粒体DNA的扩增:PCR反应体系为30μL,反应混合物中包括以下成分:3′端及5′端引物各6pmol,2×pfu酶 PCR Mix 15μL,10ng DNA模板。PCR循环参数为:23F23R 95℃ 5min;94℃ 30s、52℃ 30s、72℃ 80s,35个循环;72℃ 7min。将线粒体DNA PCR扩增产物及纯化产物进行琼脂糖凝胶小电泳,检测扩增产物的有无并进行DNA粗定量。胶浓度为20g/L琼脂糖凝胶(含EB 0.5mg/L),电极间距离15cm,加样4μL(3μL样本,1μL溴酚兰)。电泳条件:120V,20min;电极缓冲液1×TAE。使用Millionpore 96 PCR purification plate纯化。
1.2.3 线粒体DNA测序反应及序列分析
反应体系为10μL,反应混合物中含:BigDye Terminator Ready Reaction mix 3.1(荧光标记ddNTP、Dntp、TaqDNA聚合酶、MgCl2、TrisHCl buffer pH 9.0)0.7μL,5′或3′端引物0.3μmol/L,PCR扩增后产物10ng。反应条件为:96℃ 10s,50℃ 5s,60℃ 4min,25个循环。测序产物经沉淀用ABI3730序列分析仪测序扫描,得到各样本的线粒体DNA序列。
1.3 数据分析
利用Sequence Analysis 5.1软件与Anderson标准序列比较,显示变异碱基。线粒体高变区Ⅱ的DNA序列用DNA TAR软件包中的Seqman进行拼接,然后参照线粒体剑桥序列,用该软件包中的MegAlign进行比对,比对结果用Excel进行统计。用Arlequin计算单倍型频率及DNA序列间的配对距离(采用Kimura2参数模型)。用Mega软件绘制单倍型的系统发生树。
2 结 果
2.1 云南怒族线粒体高变区Ⅱ突变位点统计结果
测序结果显示,在线粒体DNA高变区Ⅱ(HVRⅡ)73~366之间与Anderson序列比较,云南怒族65名无关个体共发现有59个单倍型,401个突变点,其中突变率较高的几个碱基序列为:73 A→G突变率为100%;263 A→G突变率为83%;152 T→C突变率为60%;310 T→CTC突变率为53%;235 A→G突变率为46%;266 T→CC突变率为20%。线粒体DNA D环区HVR II多态性检测结果见图1。
2.2 云南怒族线粒体高变区Ⅱ单倍型结果
65例样本中共发现59个单倍型(表1)。用Arequnin软件计算单倍型频率及DNA序列间的配对距离。在云南怒族65名个体线粒体DNA D环区HVRⅡ的59个单倍型中,单倍型频率分布在0.015~0.062之间(表1)。
2.3 云南怒族线粒体DNA HVRⅡ评价参数计算结果 2.4 系统发生树的结果 高变区Ⅱ的系统发生树(序列之间的距离采用Kimura2参数法,采用NJ法绘制系统发生树)表明,59种单倍型可以大致分为3类,其中:hap2、5、55、53、22、28、32、47、54、34、14、3、17、20、36、43、42、33、18、31、9、48、24、25、16、56、23、44、59、4、27、57、6、58、37、40、41分为1类;hap49、52、8、38、1、15、46、21、50、10、13、19分为另一类;余下的为第三类(图2)。表1 65名云南怒族群体线粒体DNA D环区高变区Ⅱ单倍型频率(略)表2 65名云南怒族群体线粒体DNA D环高变区Ⅱ基因多态性指标结果(略) 3 讨 论 本研究选择云南怒族65名无关个体进行线粒体DNA高变区Ⅱ的序列分析,研究结果表明在线粒体DNA D环HVRⅡ有多个碱基突变,这表明云南怒族线粒体DNA HVRⅡ具有高度序列多态性,可以作为法医学个体识别的遗传标记。从云南怒族线粒体DNA HRVⅡ的碱基突变类型来看,突变以碱基转换为主,碱基转换率占突变的80%以上,以嘌呤(AG)之间的转换最多,这在线粒体DNA的突变中是个共同特点。 线粒体DNA序列作为个体识别遗传标记的一个重要条件是其序列中隐藏的多态性信息,其衡量的参数是基因差异度和核苷酸多态性,前者代表线粒体DNA序列多态性在某一群体中的个体识别能力,后者用来衡量在样本中随机抽取2个个体,相同位置处的2个核苷酸不相同的概率。本研究云南怒族的基因差异度在99%以上,耦合概率值为0.1174+/-0.0610(表2),这表明线粒体DNA D环HVRⅡ的序列可以作为个体识别的遗传标记。但是,线粒体DNA在遗传中缺乏重组,其表现为连锁遗传,16569bp的全序列只是作为一个基因座遗传,序列数据按单倍型计算,一般情况下,四代以内所有母系后代的线粒体DNA序列可能完全相同,因此作为遗传标记尚不能单独使用进行个体认定。但在某些法医学个体识别中,例如遇到微量腐败降解的检材、毛发、骨骼等检材以及单亲案件(母亲)的亲子鉴定时,利用线粒体DNA的多态性进行检验则有明显优势。
根据云南怒族线粒体DNA HVRⅡ突变位点统计,得单倍型数目、多态性位点数目、单倍型多态性(基因差异度)、平均配对差异平均数目、核苷酸多态性(表2)。单倍型多态性(haplotype persity or gene persity)由公式[23] h=nn-11-∑ki=1p2i得到,其中:n是样本数,k是单倍型数,Pi指第i个单倍型的频率,这个指标是用来衡量在样本中随机抽取2个个体,其具有不同单倍型的概率;配对差异平均数目(mean number of pairwise differences)是通过公式[3]=∑ki=1∑kj=1pipjij得到,其中:pi,pj分别是第i或第j个单倍型的频率,而ij指的是单倍型i和单倍型j分化后,突变数目差异的一种估计,这个指标可用来衡量不同单倍型之间核苷酸的差异程度;核苷酸多态性(nucleotide persity)由公式[23]n=∑i=1∑j参考文献
[1]ROBIN ED, WONG R. Mitochondrial DNA molecules and virtual number of mitochondria per cell in mammalian cells [J]. Cell Physiol, 1988, 136:507513.
[2]YAO YG, NIE L, HARPENDING H, et al. Genetic relationship of Chinese ethnic populations revealed by mtDNA sequence persity [J]. Am J Phys Anthropol, 2002, 118(1):6376.
[3]EXCOFFIER L, LAVAL G, SCHNEIDER S. Arlequin (version 3.0): an integrated software package for population genetics data analysis [J/OL]. Evol Bioinform Online, 2005,1:4750.