国际核心期刊咨询网

当前位置:首页>>农业论文 > 正文

橄榄转录组密码子使用偏好性及其影响因素

发布时间:2020-01-11

  摘 要: 为了解橄榄密码子使用偏好特征,以福榄 1 号橄榄为材料,利用 codonW 和 EMBOSS 等软件分析橄榄转录组密码子使用偏好性参数,并探讨偏好性形成的可能因素。结果表明,橄榄转录组平均有效密码子数( ENc) 、密码子 G 和 C( GC) 含量及密码子第 3 位上 G 和 C( GC3s) 含量分别为 51. 80、0. 435 和 0. 377,表明橄榄转录组密码子使用偏好性较弱,且倾向使用富含 A 和 T 且以 A 或 T 结尾的密码子。橄榄转录组高低表达基因样本之间同义密码相对使用度( RSCU) 差异较小,其中 CGC、ATC、CTC 和 ACC 等可作为橄榄最优密码子群。密码子组分分析、中性绘图分析、ENc-GC3s 关联分析和偏倚分析结果表明,橄榄转录组密码子使用偏好性可能是以突变压力为主,多种作用方式共同影响的结果。此外,烟草和酵母菌可作为橄榄目标基因异源转化的理想受体系统。本试验结果为进一步研究橄榄遗传背景和分子进化提供了一定的科学依据。

橄榄转录组密码子使用偏好性及其影响因素

  关键词: 橄榄; 转录组; 密码子使用偏好性; 突变

  密码子是生物体遗传和变异的基本单元,生物体中,一种氨基酸一般对应多个密码子,称为同义密码子,而生物体基因编码氨基酸对同义密码子的选择并非完 全 随 机,存 在 密 码 子 使 用 偏 好 性 ( codon usage bias,CUB) [1]。物种之间[2-3]、器官之间[4]、细胞核基因和细胞器基因之间[5]、基因家族成员之间[6]均存在不同的密码子使用偏好模式,但一般认为近缘物种密码子使用偏好性相对一致。大量研究表明,生物体对同义密码子的选择不改变其蛋白质种类,但会影响蛋白质的翻译效率,且在长期进化过程中,突变的最优密码子往往更倾向存在于高表达的基因和具有丰富多态性的位点中,从而保持密码子选择的有效性[7-9]。

  密码子使用偏好性是突变压力和自然选择 2 种作用力相互平衡的结果,但作用力的主成分却往往不一致[10-11],如柑橘[12]、白花蝇子草[13]和云杉[14]等主要是自然选择的结果,咖啡[15] 主要受突变压力,而玉米[16]、菊花[17]和二穗短柄草[18]被认为是 2 种因素共同作用的结果。研究表明,密码子使用偏好性的形成还与基因长度、基因功能、基因表达水平[19]、内含子数量[20]、蛋白亲水性[19]、mRNA 二级结构[21]、tRNA 丰度[22]等有关。此外,在基因异源表达和遗传转化过程中,目标基因与宿主基因组之间的密码子使用偏好性差异也会导致基因甲基化或表达沉默,根据宿主基因组密码子使用偏好性优化和改造目标序列密码子,对异源转化试验的顺利开展也具有重要意义[23]。

  橄榄[Canarium album ( Lour.) R.]为橄榄科橄榄属常绿乔木果树,其果实富含大量酚类化合物、黄酮类化合物、多糖、氨基酸等营养成分,是一种深受消费者青睐的药食两用作物[24]。橄榄也是我国热带和亚热带地区特色名贵果树,然而其耐寒性差,在福建闽侯、闽清、尤溪、上杭等橄榄主产区均发生过大规模冻害,导致产量锐减甚至绝收,低温冻害已成为橄榄产业稳定发展的重要制约因素[25]。此外,橄榄遗传背景和分子进化研究起步较晚,目前国内外对橄榄密码子偏好性相关报道也并不常见[26]。开展橄榄密码子尤其是低温胁迫下转录组密码子偏好性分析,对进一步揭示橄榄遗传背景及其抗寒机制具有重要作用。

  本研究以低温胁迫处理后通过 Illumina HiSeq 平台测序获得的福榄 1 号橄榄转录组数据为基础,利用 codonW、EMBOSS 等软件对橄榄转录组密码子使用偏好特征及其可能的影响因素进行分析,以期为橄榄遗传背景和分子进化研究提供一定的科学依据。

  1 材料与方法

  1. 1 材料及处理

  2017 年 3 月,福建省农业科学院果树研究所橄榄课题组对选育的橄榄鲜食优良品种福榄 1 号进行低温胁迫处理,并基于 Illumina HiSeq 平台进行转录组测序和数据分析。随后,参照张太奎等[27]的方法编写 perl 脚本程序,从转录组中筛选并提取满足以下条件的编码序列用于后续分析: 包含起始密码子 ATG 并以终止密码子 TAA、TAG 或 TGA 结尾的完整 CDS 序列; 不含有内含子,编码区长度大于 300 bp 的蛋白质编码区序列。此 外,拟 南 芥 ( Arabidopsis thaliana ) 、烟 草 ( Nicotiana tabacum) 、大肠杆菌( Escherichia coli) 和酵母菌( Saccharomyces cerevisiae) 的密码子使用偏好性数据来源于 Codon Usage Database 在线数据库( http: / / www.kazusa. or.jp /codon /) ,其中用于数据分析的 4 个物种基因样本数分别为 80 395、1 534、5 347 和 1 611 503,所涉及的密码子个数分别为 31 098 475、 609 684、1 611 503 和 6 534 504。

  1. 2 方法

  1. 2. 1 密码子使用偏好性参数分析 采用 codonW 软件分析橄榄转录组密码子使用偏好性参数,包括有效密码子数( effective number of codon,ENc) 、密码子适应指数( codon adaptation index,CAI) 、同义密码子相对使用度( relative synonymous codon usage,RSCU) 、密码子 G 和 C( GC) 平均含量、密码子第 3 位上 G 和 C ( GC3s) 含量、密码子第 1、第 2 位上 G 和 C( GC12) 的平均含量及密码子第 3 位上 A、G、C 和 T( A3、G3、C3 和 T3) 含量。采用 EMBOSS 在线程序的 CUSP 模块分析密码子使用频率( frequency of optional codons,FOP) ( http: / /emboss. toulouse. inra. fr /cgi-bin / emboss / cusp) 。

  1. 2. 2 中 性 绘 图 分 析 中 性 绘 图 分 析 ( neutrality plot) 以 GC12 为纵坐标,GC3s 为横坐标,通过分析编码区密码子 GC12 和 GC3s 的相关性衡量自然选择和突变压力对密码子使用偏好性的影响程度。如 果 GC12 和 GC3s 存在相关性,则密码子不同位置上碱基的组成无差异,密码子使用偏好性主要受突变压力影响; 如果二者不相关,说明密码子第 1 和第 2 位上碱基组成与第 3 位差异显著,密码子使用偏好性主要受自然选择作用。

  1. 2. 3 ENc-GC3s 关 联 分 析 ENc-GC3s 关 联 分 析 ( ENc-GC3s plot) 以 ENc 为纵坐标,GC3s 为横坐标,绘制散点图和标准曲线,如果基因分布在标准曲线附近,其密码子使用偏好性主要受突变压力影响,若基因分布在标准曲线下方较远位置,则认为密码子使用偏好性主要受自然选择作用。其中,ENc 比值频率作为重要参考标准,反映了 ENc 实际值与期望值之间的差异,通常认为 ENc 比值频率介于-0. 05 ~ 0. 05[28]时,密码子使用偏好性主要受突变压力影响。

  1. 2. 4 偏倚分析 偏倚分析( PR2-plot) 以 A3 /( A3+ T3) 为纵坐标,G3 /( G3+C3) 为横坐标,分析编码区中嘌呤和嘧啶之间的相对关系。若基因样本主要分布在平面图的中心位置,说明 4 种碱基出现的概率相对一致,密码子使用偏好性主要受突变压力影响,若偏离中心位置较远说明该样本可能还存在其他作用因素。

  1. 2. 5 最优密码子分析 参照 Yang 等[29]和吴彦庆等[30]的方法,对筛选的橄榄转录组基因样本按 CAI 值由高到低排序,分别提取前后各 5%的序列作为高低表达基因样本并分析其 RSCU 值。将高表达转录本中RSCU 值明显高于低表达转录本的密码子确定为橄榄转录组最优密码子群。

  2 结果与分析

  2. 1 GC 含量与中性绘图分析

  橄榄低温胁迫转录组中筛选获得符合条件的 CDS 序列 2 664 条,包含 492 676 个密码子,将样本进行密码子偏好性分析。由图 1-A 可知,橄榄转录组密码子 GC 变化范围为 0. 325~ 0. 588,平均为 0. 435,其中大部分基因介于 0. 4~ 0. 5 之间,占总数的 93. 56%,表明橄榄转录组密码子总体上偏好使用碱基 A 和 T; 由图 1-B 可知,橄榄转录组密码子 GC3s 变化范围为 0. 234 ~ 0. 802,基因样本间差异较大,但大部分介于 0. 3 ~ 0. 5 之间,占总数的 94. 16%,平均值仅为 0. 377,说明橄榄转录组密码子末位碱基同样偏好使用 A 或 T。

  中性绘图分析结果如图 2 所示,基因样本集中在中性图回归线两侧 ( y = 0. 033x + 0. 451) ,GC12 和 GC3s 呈正相关,相关性系数为 0. 033( R2 = 0. 004) ,即密码子 3 个位置上的碱基组成无差异,表明橄榄转录组密码子使用偏好性主要受突变压力影响。

  2. 2 ENc 与 GC3s 关联分析

  ENc 是衡量密码子使用偏好性的重要参考指标,其值介于 20 ~ 61 之间,越接近 61 则密码子使用偏好性越弱,当 ENc 值为 61 时表明该基因样本对密码子的使用完全随机,反之越接近 20 则密码子使用偏好性越强,35 是基因密码子使用偏好性强弱的重要参考依据[31]。由图 3 可知,橄榄转录组密码子 ENc 值介于 34. 65 ~ 61. 00 之间,平均为 51. 80,且大部分基因 ENc 介于 45. 00 ~ 60. 00 之间,表明其偏好性普遍较弱。在这些基因样本中,ENc 值小于 35 的基因仅有 1 个,为功能未知的蛋白; 而 ENc 值达到 61 的基因样本数目为 25,占总数的 2. 15%,主要涉及编码 tRNA 特异性腺苷脱氨酶、DNA 聚合酶亚基、细胞色素、环指蛋白、糖基转移酶,以及一些功能未知的蛋白。

  进一步对 ENc 和 GC3s 关联分析发现,橄榄转录组各基因样本均匀分布在标准曲线( y = -170. 82x2 + 169. 48x + 12. 965,R2 = 0. 276) 两侧( 图 4) 。ENc 比值频率取值范围为-0. 159 ~ 0. 344,其中介于-0. 1 ~ 0. 1 之间的基因样本数占总数 86. 08%,-0. 05 ~ 0. 05 之间的基因样本数占总数 59. 54%,实 际 ENc 值 和 理 论 ENc 值差异相对较小( 图 5) ,说明橄榄转录组密码子使用偏好性主要受碱基组分影响,突变压力是其形成的主要作用方式。

  2. 3 偏倚分析

  由图 6 可知,橄榄转录组基因样本平均分布位置为( 0. 438,0. 555) ,说明总体上密码子腺嘌呤 A 的比例高于胸腺嘧啶 T,鸟嘌呤 G 的比例低于胞嘧啶 C。转录组中大部分基因样本位于平面中心点附近,嘌呤和嘧啶出现的概率相对一致,密码子使用偏好性可能主要受突变压力影响。此外,也存在部分基因样本偏离中心点较远,其密码子使用偏好性可能还受其他作用力影响。综上,橄榄转录组密码子使用偏好性是以突变压力为主,多种作用方式共同影响的结果。

  2. 4 转录组最优密码子分析

  以 CAI 作为衡量依据,对 CAI 指数由高到低前后各 5%的序列作为橄榄高低表达基因样本进行 RSCU 分析,结果如表 1 所示。高低表达基因样本之间的RSCU 值差异相对较小,这可能与橄榄转录密码子使用偏好性较弱有关。但CGC、ATC、CTC和ACC等在高表达样本组中的 RSCU 值仍明显高于低表达样本组,可作为橄榄转录组最优密码子群。这些最优密码子均以 C 结尾,表明橄榄转录组最优密码子偏好使用 G 或 C 结尾,而橄榄转录组密码子整体偏好使用 A 或 T 结尾,可能是造成其使用偏好性较弱的关键因素之一。

  2. 5 密码子使用频率分析

  物种间严格的密码子使用偏好性是影响异源转化效率的重要因素,通常以密码子使用频率作为参考标准[23]。由图 7 可知,橄榄与拟南芥和烟草这 2 种模式植物之间的整体密码子使用偏好性差异极小,除拟南芥 GCG 外( 比值为 0. 499) ,其他密码子均无明显差异; 而与大肠杆菌和酵母菌相比,存在使用偏好性差异的密码子个数分别为 11 和 3。表明烟草和酵母菌可作为橄榄目标基因遗传转化功能验证或异源表达的理想受体系统。

  3 讨论

  在长期进化过程中,特定物种往往形成适应自身基因组环境的密码子使用模式[32]。本试验中,橄榄转录组密码子平均 ENc 为 51. 80,远高于 35,与橄榄类黄酮异构酶基因 CHI 的 ENc 值( 50. 89) 较为接近[26],表明橄榄转录组密码子使用偏好性较弱,同时橄榄中不同基因密码子在长期进化过程中可能保持较高的同步性。而在 GC 含量方面,橄榄转录组偏好使用富含 A 和 T 且以 A 或 T 结尾的密码子,符合大部分双子叶植物密码子组成规律[33]。此外,橄榄最优密码子群体数目较少,且高低表达基因样本间 RSCU 值差异不明显,已确定的最优密码子偏好以 G 或 C 结尾。由此推断,橄榄本身密码子使用偏好性弱且主要偏好使用以 A 或 T 结尾的密码子是造成其最优密码子缺乏的重要原因之一。

  密码子使用偏好性是突变压力和自然选择共同作用的结果。橄榄密码子组分、中性绘图、ENc-GC3s 关联和偏倚绘图等综合分析认为,橄榄转录组密码子使用偏好性是突变压力为主,多种作用方式共同影响的结果。结合橄榄转录组密码子组分、赖瑞联等[34]和 Novembre[35]的观点推断,这种可能从 GC 向 AT 突变为主,即橄榄转录组密码子可能在突变压力作用下,由 GC 向 AT 突变从而形成了橄榄特定密码子使用偏好性,而偏好性强弱也与突变作用力大小有关。

  密码子使用频率常被用于比较不同物种对特定密码子的选择和使用偏好,为目标基因进行模式生物异源转化提供参考[36]。本研究中,橄榄转录组与模式植物基因组间的密码子使用频率较为一致,预示在长期进化过程中其密码子使用偏好性并未发生特异性改变,这也是造成其密码子使用偏好性偏弱的可能因素之一。在后续研究中,可进一步与楝科、芸香科和苦木科等物种密码子进行比较,同时对密码子的具体区域分布进行精细分析,研究基因蛋白编码区与非编码区之间、内含子与外显子之间,以及可变剪接体之间密码子的使用偏好模式等。此外,通过结合现代高通量测序技术对橄榄品质、产量和抗性等相关转录本间密码子使用偏好模式进行分析,可为橄榄目标性状形成的遗传机理研究提供重要依据。

  橄榄转录组密码子使用偏好性及其影响因素相关期刊推荐:《核农学报》(ISSN1000-8551)创刊于1987年,由中国农业科学院农产品加工(原子能利用)研究所主办,是在原《原子能农业应用》的基础上创办的科技期刊,为中国原子能农学会会刊。主要刊登核技术(包括各种辐射源人工诱变遗传和育种技术、食品加工技术和同位素示踪技术等)在农业科学中应用的学术论文、综述、科技信息及知识介绍等。此外,还刊登其他相关技术,如农产品和食品贮藏加工、分子生物学、环境保护、生态农业、农业生物技术、节水农业等方面的学术论文。

回到顶部