生物信息学方法大规模筛选肿瘤差异表达基因

论文价格:0元/篇 论文用途:仅供参考 编辑:论文网 点击次数:0
论文字数:**** 论文编号:lw2023126111 日期:2026-01-12 来源:论文网

【摘要】 目的 利用数据库中已有的基因信息快速筛选鉴定出潜在的肿瘤相关基因。方法 利用EST数据库中的基因信息,采用数字化差异显示(DDD)方法,对17种不同肿瘤组织的全基因组进行筛选。结果 获得了130个上调基因和159个下调基因,大多为编码细胞骨架蛋白、核糖体亚单位的基因以及与物质代谢、细胞周期、信号传导、调节转录和翻译过程有密切关系的基因。这些基因在12号染色体上出现频率最高,而在21号和Y染色体上很少出现。结论 生物信息学筛选是一种快速有效的筛选方法。本实验所得结果对今后肿瘤标志物的鉴定奠定了基础,也为肿瘤标志物的筛选策略提供了新的思路。

【关键词】 生物信息学;肿瘤;数字化差异显示;EST

  ABSTRACT: Objective To identify potential candidate genes related to the cancerous phenotype by analyzing databases publicly available. Methods Using a datamining tool called Digital Differential Display (DDD) from the Cancer Gene Anatomy Project database, ESTs from 17 different tumor types were analyzed for differential expression. Results We obtained 130 upregulated and 159 downregulated genes, most of which are related to cytoskeleton, ribosomal subunit, substance metabolism, cell cycle, signal conduction, transcription and translation. These genes appear most frequently on chromosome 12 but rarely on chromosome 21 and Y. Conclusion In silico identification is a highthroughput screening strategy. Our study may lay a foundation for identification of future caner markers and provide a new thought for screening strategy of cancer markers.

  KEY WORDS: in silico; tumor; digital differential display; EST

  肿瘤通常是由基因组中某些基因的数量或者结构发生改变而引起的。对肿瘤组织中差异表达的基因进行转录子水平的大规模分析,有望筛选出在肿瘤发生发展中发挥重要作用的基因。目前,已有多种大规模筛选的方法,如SAGE、微阵列、基因芯片等[1],可以对来源于不同组织类型和病理类型的标本的多个基因表达水平进行并行分析,已经得到广泛应用。

  随着人类基因组测序的完成,基于生物信息学数据库的筛选方法也日益得到科研工作者的应用[23]。该方法可利用已有的数据信息,进行大规模高通量筛选,花费少、信息量大。虽然目前已有不少研究者利用这种方法进行差异基因的筛选,但是对于全基因组以及多组织的肿瘤相关基因的筛选研究却很少。

  在本实验中,我们采用CGAP网页中的数字化差异显示(digital differential display)工具,筛选在17种肿瘤组织与其对应的正常组织中差异表达的基因。对在≥2种肿瘤组织中,表达量大于对应正常组织10倍的基因(上调基因)以及表达量不及对应正常组织1/10的基因(下调基因)进一步进行分析。

  1 材料与方法

  1.1 数据库

  利用基于EST信息的数据库进行肿瘤差异表达基因的筛选,共选取17种组织类型的肿瘤组织及其对应的正常组织的EST文库,包括骨、血液、脑、乳腺、结肠、眼、肾脏、肝脏、肺脏、淋巴结、肌肉、卵巢、胰腺、胎盘、前列腺、皮肤以及睾丸。所有EST文库均满足以下条件:①组织来源与病理状态明确;②非混合组织文库;③非标准化且非消减文库。

  1.2 数字化差异显示

  利用CGAP网站中提供的cDNA数字化差异显示(DGED)工具筛选,进入其主页,参数设置均采用默认值,pool A 为肿瘤组织,pool B为对应的正常组织,对17种组织类型分别进行筛选,所选择的文库构建方式均为非标准化非消减。F值设置为2,P值设置为0.05。F值表示某一基因在某一肿瘤组织中相对其在对应正常组织中的表达量。最终的输出结果为在某一肿瘤组织中表达量≥2倍或≤1/2对应正常组织中表达量的所有有统计学意义的基因。F=肿瘤组织文库中代表某一基因的EST数量/肿瘤组织文库中所有EST数量对应正常组织文库中代表某一基因的EST数量/正常组织文库中所有EST数量
  1.3 肿瘤相关候选基因的选择

  在17种组织所有的输出结果中,选取在至少2种肿瘤组织中表达量与对应正常组织中表达量相差10倍以上的基因(F≥10或F≤1/10)作为肿瘤相关候选基因,分为上调基因和下调基因。

  1.4 候选基因的分类及染色体定位

  候选基因的分类及染色体定位来源于CGAP网站中gene finder工具中对查找基因的描述。

  1.5 经实验验证的候选基因的电子表达谱分析

  查阅筛选出的候选基因的相关文献,对于已经实验验证的上调和下调基因进行电子表达谱分析。利用CGAP网站中的gene finder工具查找基因,查询结果中的Monochromatic SAGE/cDNA Virtual Northern即为电子杂交结果。

  2 结 果

  2.1 肿瘤组织中的差异表达基因 本实验使用生物信息学方法对多种肿瘤组织和相应正常组织进行大规模筛选,以期获得已知的或者新的肿瘤差异表达基因。结果见表1。筛选出的基因包括已经被广泛研究的LDHB和FOS等。在≥2种组织中同时上调的基因有130个,同时下调的基因有159个。表1 各种肿瘤组织中F≥10的基因数(略)

  同一个基因在一种肿瘤组织中上调,而在其他肿瘤组织中可能下调,例如FDPS基因,EST电子杂交结果显示该基因在血液、脑、结肠、眼、肾脏、肝脏、肺、淋巴结、乳腺、肌肉、卵巢、胰腺、胎盘、前列腺、睾丸组织的肿瘤中表达上调,而在骨和皮肤组织的肿瘤中表达下调。同一个基因在同一肿瘤中EST电子杂交和SAGE电子杂交结果也可能不同,例如FDPS基因,在肾脏肿瘤中,EST电子杂交结果显示该基因在肿瘤组织中表达上调,而SAGE电子杂交结果显示其表达下调。

  2.2 候选基因的分类

  筛选出的上调和下调基因中,均含有大量的编码细胞骨架蛋白、核糖体亚单位的基因以及与物质代谢、细胞周期、信号传导、调节转录和翻译过程有密切关系的基因。仅在上调基因中筛选出由缺氧诱导的因子、分子伴侣、与蛋白修饰相关的基因,而与凝血反应、血管生成以及调节激素水平相关的基因仅在下调基因中被筛选出。见表2、表3(功能未知的基因均未列出)。表2 在≥2种组织中F值≥10的上调基因(略)表3 在≥2种组织中F值≤1/10的下调基因(略)

  2.3 候选基因的染色体定位

  对在≥2种组织中同时上调的130个基因和在≥2种组织中同时下调的159个基因进行染色体定位。为避免可能出现的偏倚,计算某一染色体中上或(和)下调基因数与该染色体所含基因数的比值。结果见表4。可以看出,某些染色体相对“活跃”。在21号和Y染色体上极少出现肿瘤相关基因,而在12号染色体中肿瘤相关基因出现的频率明显多于其他染色体。表4 候选基因的染色体定位(略)

  2.4 经实验验证的候选基因的电子表达谱分析

  在筛选出的130个上调基因中有23个已经实验验证在肿瘤中表达上调(17.7%),在159个下调基因中有16个经实验验证在肿瘤中表达下调(10.1%)。这些基因的电子杂交结果见表5和表6。表5 经实验验证的在肿瘤组织中上调的基因电子杂交结果(略)表6 经实验验证的在肿瘤组织中下调的基因电子杂交结果(略)

  3 讨 论

  随着生物技术和生物信息的飞速发展,基因芯片、微阵列以及SAGE等技术已经被广泛应用于肿瘤相关基因的筛选。这些方法可以并行处理多项信息,但是价格昂贵,同时由于样本中RNA含量有限,可能会在不同的实验中产生误差。而本实验以EST数据库中的信息为研究对象,数据量大,基本可以消除由于样本量小而产生的误差。当然,基于EST数据库的肿瘤差异表达基因的生物信息学筛选也存在一些不足,例如文库测序数量较少、文库大小不一、文库组织来源不明确,以及某些文库由多种组织混合构建[1315]。基于这些不足,本实验对文库的选择也进行了限制,以保证结果更真实可靠。同时,由于该实验的基础是代表某一基因的EST拷贝数,因此所选文库必须为非消减非标准化的文库。

  实验中比较了17种肿瘤组织与其对应的正常组织中基因的表达量,筛选出可能的肿瘤差异表达基因。关于统计参数的选择,用不同分析参数进行分析,发现对比分析时参数不宜太严格,否则会筛选去掉很多有价值的基因。分析时F值选择2,P值选0.05,得到结果后再选取差异表达大于10倍的基因可以得到较理想的结果。其中在≥2种组织中同时满足F值≥10(上调)的基因有130个,在≥2种组织中同时满足1/F值≥10(下调)的基因有159个。这种生物信息学筛选方法可以短时间内筛选出大量差异表达基因,通过进一步的实验验证,这些基因可能会是用于肿瘤诊断治疗的良好靶标。

  130个上调基因中,含有23个编码核糖体亚单位组成部分的基因以及大量与转录翻译过程相关的基因,这些基因产物对于调节肿瘤的蛋白质合成具有重要意义[16]。肿瘤的一个重要特性就是无限增殖,调控细胞周期的基因在肿瘤的发生发展中起了重要作用。在筛选出的上调基因中,CDK4是在由G1期向S期进展中起重要作用的基因,该基因编码的蛋白与cdc28和cdc2高度相似,受D型细胞周期蛋白和CDK抑制因子p16调控,该基因编码产物对Rb基因产物的磷酸化起重要作用[1719]。在筛选出的130个上调基因中,细胞角蛋白占5个,分别为KRT4、KRT14、KRT17、KRT18、KRT19。角蛋白的降解产物为可溶性片断,可在患者的血液中检测到,因此可作为肿瘤诊断的标志物[20]。

  本实验除了筛选出多个具有潜在诊断治疗意义的差异表达基因外,还分析了这些基因在不同染色体上出现的几率,为今后的肿瘤发生发展的分子机制研究奠定了基础,也为肿瘤相关基因的筛选策略提供了新的思路。
  
  总之,本实验结果表明,利用EST数据库对全基因组进行肿瘤差异表达基因的生物信息学筛选,是一种经济快速有效的筛选方法。这些结果对今后肿瘤标志物的鉴定具有重要意义,为今后的筛选策略提供了新的思路。

参考文献


  [1]GRAY JW, COLLINS C. Genome changes and gene expression in human solid tumors [J]. Carcinogenesis, 2000, 21(3):443452.

  [2]RAJKOVIC A, YAN MSC, KLYSIK M, et al. Discovery of germ cellspecific transcripts by expressed sequence tag database analysis [J]. Fertil Steril, 2001, 76(3):550554.

  [3]WANG J, LIANG P. DigiNorthern, digital expression analysis of query genes based on ESTs [J]. Bioinformatics, 2003, 19(5):653654.

  [4]STOCK C, BOZSAKY E, WATZINGER F, et al. Genes proximal and distal to MYCN are highly expressed in human neuroblastoma as visualized by comparative expressed sequence hybridization [J]. Am J Pathol, 2008, 172(1):203214.

  [5]KOSACKA M, JANKOWSKA R. The prognostic value of cytokeratin 19 expression in nonsmall cell lung cancer [J]. Pneumonol Alergol Pol, 2007, 75(4):317323.

  [6]DE BORTOLI M, CASTELLINO RC, LU XY, et al. Medulloblastoma outcome is adversely associated with overexpression of EEF1D, RPL30, and RPS20 on the long arm of chromosome 8 [J]. BMC Cancer, 2006, 6:223.

  [7]HAUG U, ROTHENBACHER D, WENTE MN, et al. Tumour M2PK as a stool marker for colorectal cancer: comparative analysis in a large sample of unselected older adults vs colorectal cancer patients [J]. Br J Cancer, 2007, 96(9):13291334.

  [8]LING J, WIEDERKEHR U, CABINESS S, et al. Application of flow cytometry for biomarkerbased cervical cancer cells detection [J]. Diagn Cytopathol, 2008, 36(2):7684.

  [9]IDE Y, MIYOSHI E, NAKAGAWA T, et al. Aberrant expression of NacetylglucosaminyltransferaseIVa and IVb (GnTIVa and b) in pancreatic cancer [J]. Biochem Biophys Res Commun, 2006, 341(2):478482.

  [10]YANG Z, CHANG YJ, MIYAMOTO H, et al. Transgelin functions as a suppressor via inhibition of ARA54enhanced androgen receptor transactivation and prostate cancer cell growth [J]. Mol Endocrinol, 2007, 21(2):343358.

  [11]KANEDA A, KAMINISHI M, SUGIMURA T, et al. Decreased expression of the seven ARP2/3 complex genes in human gastric cancers [J]. Cancer Lett, 2004, 212(2):203210.

  [12]BALDI A, DE LUCA A, MORINI M, et al. The HtrA1 serine protease is downregulated during human melanoma progression and represses growth of metastatic melanoma cells [J]. Oncogene, 2002, 21(43):66846688.

  [13]SCHMITT AO, SPECHT T, BECKMANN G, et al. Exhaustive mining of EST libraries for genes differentially expressed in normal and tumour tissues [J]. Nucleic Acids Res, 1999, 27(21):42514260.

  [14]IMYANITOV EN, TOGO AV, HANSON KP. Searching for cancerassociated gene polymorphisms: promises and obstacles [J]. Cancer Lett, 2004, 204(1):314.

  [15]QIU P, WANG L, KOSTICH M, et al. Genome wide in silico SNPtumor association analysis [J]. BMC Cancer, 2004, 4(1):4.

  [16]BADER AG, VOGT PK. An essential role for protein synthesis in oncogenic cellular transformation [J]. Oncogene, 2004, 23(18):31453150.

  [17]MEDEMA RH, HERRERA RE, LAM F, et al. Growth suppression by p16ink4 requires functional retinoblastoma protein [J]. Proc Natl Acad Sci, 1995, 92(14):62896293.

  [18]LINDBERG D, HESSMAN O, AKERSTROM G, et al. Cyclindependent kinase 4 (CDK4) expression in pancreatic endocrine tumors [J]. Neuroendocrinology, 2007, 86(2):112118.

  [19]HALL M, BATES S, PETERS G. Evidence for different modes of action of cyclindependent kinase inhibitors: p15 and p16 bind to kinases, p21 and p27 bind to cyclins [J]. Oncogene, 1995, 11(8):15811588.

  [20]MOLL R. Cytokeratins in the histological diagnosis of malignant tumors [J]. Int J Biol Makers, 1994, 9(2):6369.

QQ 909091757 微信 371975100