劉洋 路妍 景嵐
摘要:為分析了解向日葵( L.)核苷酸結合位點( site,簡稱NBS)型抗病基因編碼時各密碼子的使用情況,以向日葵全基因組NBS型抗病基因的255條基因序列為來源密碼子使用偏性,利用軟件對每個基因序列進行密碼子統計分析。結果表明,向日葵NBS型抗病基因使用A/T(U)結尾的密碼子占比大于G/C結尾的密碼子,且有效密碼子數( of codon,簡稱ENC)平均值為51.40,整體偏好性較弱,但第3位堿基偏好使用以A/T(U)結尾的密碼子。從同義密碼子相對使用頻率( usage,簡稱RSCU)分析得到第3位為A、T結尾的密碼子占密碼子總數(RSCU>1)的比例最高。ENC-GC3s分布圖表明,堿基突變是影響密碼子偏好性的關鍵因素。同時相關性分析結果還表明,ENC與A3s、T3s呈極顯著負相關關系,多種不同分析都印證了向日葵NBS型抗病基因序列偏好于以A/T(U)結尾的密碼子。分析向日葵NBS型抗病基因密碼子偏好性,通過優化密碼子來提高NBS抗病基因在向日葵中的表達,可為向日葵分子改造和抗病育種提供理論依據。
關鍵詞:向日葵;NBS抗病基因;密碼子偏好性;密碼子相關參數;相關性分析
中圖分類號: S565.501;Q943.2 文獻標志碼: A 文章編號:1002-1302(2021)10-0043-05
向日葵( L.)別稱太陽花、朝陽花屬菊科()向日葵屬( L.),是世界各地均有栽培的重要的油料作物。原產地位于南美洲,起初用于觀賞。現我國新疆、內蒙古、黑龍江等北方地區均有栽培。據張一賓等在2015年的統計,全球向日葵種植面積約為2 540萬hm2,同比上年增長1.0%[1]。向日葵生長發育的過程中受到許多病原物侵染是向日葵產量下降的主要原因,而培育和科學利用抗病品種是控制植物病害最經濟有效的方式。抗病品種防御抵抗力強,能大大減少田間防治的成本,還能減少因使用農藥造成的環境污染。
當植物受到病原菌刺激后會發出一系列的信號,并分泌抗病基因編碼的抗病蛋白(R蛋白),通過識別病原菌分泌出的效應因子(Avr)后,再將信號進行傳導繼而引發一系列防御反應,最終就可以迅速地抑制病原菌對植物的侵染[2]。核苷酸結合位點作為R基因所編碼的蛋白中高度保守的區域之一,在抗病過程中起重要作用[3]。核苷酸結合位點( site,簡稱NBS)型蛋白有3個保守結構域[4],分別是磷酸結合環(P-loop,別稱-1a)、激酶2a(-2a)、激酶3a(-3a),它們一起構成了抗病蛋白的(ATP/GTP)水解和抗病信號的傳遞[5]。除了這3個保守結構域外,NBS還含有其他幾個保守區域,像GLPL和MHD等[6]。有研究表明,植物NBS型抗病基因是植物抗病基因中最大的一類,在植物自然免疫中起著重要的作用。
密碼子(codon)指mRNA或DNA中每相鄰的3個核苷酸編為一組序列,編碼某一種特定氨基酸,是生物體內信息傳遞的基本環節。密碼子偏性是生物體中編碼同一種氨基酸的同義密碼子的非均衡使用現象,由于這一現象與DNA和蛋白質相關聯,所以具有重要的生物學意義。在生物體的遺傳密碼中,除了僅含有1個密碼子的色氨酸和甲硫氨酸以外,所有其他氨基酸都具有1個以上的簡并密碼子。編碼相同氨基酸的密碼子是同義密碼子( codon),在不同物種或基因中具有選擇上的偏好,即為密碼子選擇偏好性(codon usage bias,簡稱CUB)。對于相同的物種,不同的蛋白編碼密碼子在基因中以不同的頻率出現。對于相同氨基酸,編碼氨基酸的不同密碼子的概率在不同的蛋白之間也會有所不同。因此,生物體基因會對其他氨基酸上的簡并密碼子的選擇具有一定的偏好性,結合密碼子偏好性改造相關基因的密碼子從而選擇合適的表達系統,從而提高抗病基因在向日葵體內的表達,對于優化改進向日葵抗病體系具有重要意義。
近年來,隨著科學技術的不斷發展,越來越多物種的全基因組序列已經公布出來。對基因片段或全基因組序列密碼子偏好性方面的研究也成為重點關注對象,像蘭科植物( Juss.)[7]、擬南芥[ (L.) Heynh.][8]、水稻[9]、柑橘( )[10]、葡萄(Vitis L.)[11]、香蕉(Musa nana Lour.)[12]、菠蘿[ (Linn.) Merr.][13]的密碼子偏好性均有報道。
2017年英國《》雜志報道了法國科研人員通過測序獲得了高質量的向日葵參考基因組,加速了向日葵育種計劃[14]。隨著向日葵全基因組序列測序的完成,筆者分析向日葵NBS型抗病基因編碼時各密碼子的使用情況,今后可以通過優化密碼子來提高NBS抗病基因在向日葵中的表達,為向日葵抗病育種提供理論依據。
1 材料與方法
在https:////?term=[orgn]上下載向日葵全基因組蛋白質序列,根據生物信息學分析P-loop、-2a、-3a、GLPL等4個保守結構域在基因中的峰度值,以NBS的保守結構域(P-loop、-2a、-3a、GLPL)為關鍵信息在Excel中進行檢索及篩選,共得到255個符合條件的基因序列。再通過NCBI下載相應NBS FASTA格式的堿基序列。利用軟件計算并統計分析向日葵NBS抗病基因組密碼子使用情況。軟件分析的數據主要包括同義密碼子第3位上4種堿基的出現頻率(A3s、G3s、C3s、T3s)、全基因組的GC含量、最優密碼子使用頻率( of ,簡稱FOP)、密碼子偏愛指數(codon bias index,簡稱CBI)等;采用同義密碼子的相對使用度、密碼子適應指數(codon index,簡稱CAI)和有效密碼子數( of codon,簡稱ENC)3個指標對密碼子偏好性進行評價。RSCU表示編碼氨基酸同義密碼子間的相對概率[15];RSCU的計算為某一密碼子使用的頻率和使用時預期頻率的比值。若某一密碼子的RSCU>1,則表示該密碼子是相對使用頻率較高的密碼子,反之亦然;RSCU=1則代表該密碼子無明顯偏好性[7],其計算公式如下:
=∑nij=1Xij。
式中:表示編碼第i個氨基酸第j個同義密碼子間的相對概率;Xij是編碼第i個氨基酸的第j個密碼子的出現次數;ni是編碼第i個氨基酸的同義密碼子的數量(值為1~6)。
CAI的范圍為0~1,越靠近1即表示這個基因的表達水平越高。ENC的范圍為20~61,ENC越小,相應的內源基因的表達量就越高。
2 結果與分析
2.1 全基因組NBS抗病基因序列的密碼子組成分析
分析結果(表1)表明,全基因組GC含量為36.50%~44.90%,平均GC含量為40.16%。對密碼子第3個位置上的堿基類型進行統計學分析,C、G的出現頻率平均值分別是22.05%、25.64%,而A和T(U)的出現頻率分別為39.03%、40.90%。這些結果表明,向日葵NBS型基因使用A/T(U)結尾的密碼子占比為79.93%,比G/C結尾的密碼子占比高,向日葵基因組ENC平均值為51.40,說明向日葵密碼子整體偏好性較弱。
2.2 同義密碼子使用偏好分析
用軟件計算并統計分析向日葵全基因組NBS抗病基因中所有氨基酸對同義密碼子的偏好性、使用頻率等數據。由表2可知,RSCU>1的密碼子共29個,為高頻密碼子,且第3位為A、T(U)、C和G的密碼子數量分別占RSCU>1密碼子總數的41.38%、51.72%、0、6.90%。其中第3位為T(U)的密碼子數量最多,第3位為C的密碼子數量最少,表明向日葵NBS抗病基因編碼時偏好使用以A/T(U)結尾的密碼子,較少使用以C結尾的密碼子。密碼子AGA的RSCU最大,為2.75,該密碼子的偏好性最強;編碼氨基酸Trp、Met中的UGG、AUG的RSCU均等于1,表示向日葵NBS型基因中密碼子UGG、AUG使用沒有偏好性;氨基酸Arg中的密碼子CGC的RSCU最小,為0.25,密碼子偏好性最弱。
2.3 最優密碼子的鑒定
將向日葵全基因組NBS基因序列按照ENC的大小進行排序,選取上下限區域各5%的序列數據形成高表達庫和低表達庫,再計算2個表達庫中各個密碼子的ΔRSCU,選取高表達庫中RSCU大于1而在低表達庫中小于1,共鑒定出 5個最優密碼子(表3),即AUA、GUG、ACC、UAA、GGG。其中UAA密碼子的ΔRSCU 為1.15,其偏好性最強。
2.4 ENC繪圖分析
通過繪制ENC與GC3s 的相關性散點圖,直觀地解釋密碼子使用偏好性,可以反映無選擇壓力條件下二者之間的關系。通過對向日葵全基因組NBS型抗病基因GC3s與ENC的關聯性進行分析(圖1)可知,大部分基因點都落在期望曲線附近,ENC與GC3s 呈極顯著相關關系(P
2.5 密碼子評價參數的相關性分析
密碼子各參數相關性分析結果(表4)表明,T3s與A3s、CAI呈極顯著正相關關系(P
3 討論與結論
密碼子偏好性是是翻譯過程中的重要調控參數,不同生物的密碼子使用偏性的差異非常不同。其中高表達密碼子使用偏性較大,所對應的生物體中有非常豐富的tRNA;密碼子偏好性還與mRNA的二級結構等因素相互影響[17-18]。另外,大多數密碼子的3個堿基在進化過程中都會發生突變,不同堿基的突變所表現的意義也不同。前2個位置堿基的突變一般為非同義突變會改變基因的功能,第3個堿基的突變多為同義突變對基因功能無影響。因此,分析第3位堿基的影響因素可能會揭示出密碼子偏好性的原因所在。本研究做了多種不同的統計分析,結果均表明向日葵NBS型抗病基因序列偏好于以A/T(U)結尾的密碼子。向日葵全基因組平均GC含量為40.16%,大量研究表明雙子葉植物的GC含量通常小于50%,而單子葉植物往往具有較高的GC含量,二者的密碼子偏好性具明顯差異[19]。不同植物的ENC均有所差異,蘿卜ICE1基因密碼子的ENC為51.35[20],菠蘿基因組密碼子的ENC為58.41[13],蓼科大黃屬植物CHS基因密碼子的ENC為34.35[21],紅藻rbcL基因密碼子的ENC為41.89[22]。分析所得,向日葵NBS型抗病基因密碼子的ENC為51.40,香蕉NBS型抗病基因的ENC為56.40[23],水稻NBS-LRR基因ENC變化范圍為31.22~59.47,相較于擬南芥(45.41~59.1)更大[24],更加表明不同物種不同基因所對應的密碼子偏好性均有所差異(表5)。
同時相關性分析結果還表明,ENC與A3s和T3s大小呈極顯著負相關關系,再次證明向日葵NBS型抗病基因序列偏好于以A/T(U)結尾的密碼子。這也與水稻[24]、甘薯與三淺裂野牽牛[25]的NBS抗病基因偏好于以A/T(U)結尾相一致。從ENC-GC3s分布圖中可以直觀看出密碼子的偏好性主要來自于堿基的突變,部分來自于自然選擇壓力。向日葵NBS型抗病基因使用A/T(U)結尾的密碼子占比為79.93%,比G/C結尾的密碼子高,且ENC平均值為51.40,說明向日葵NBS型抗病基因密碼子整體偏好性較弱,但第3位堿基偏好使用以A/T(U)結尾的密碼子。 從同義密碼子相對使用頻率分析得到,第3位為A、T結尾的密碼子占密碼子總數(RSCU>1)的比例最高,密碼子AGA的RSCU最大,為2.75,該密碼子的偏好性最強;通過計算RSCU高低表達庫的平均值,鑒定出AUA、GUG、ACC、UAA、GGG等5個最優密碼子。多種不同分析都印證了向日葵NBS型抗病基因序列偏好于以A/T(U)結尾的密碼子。研究分析密碼子偏好規律并優化密碼子來提高NBS抗病基因在向日葵中的表達,未來可以對向日葵進行分子改造和抗病育種提供理論依據和指導作用。
參考文獻:
[1]張一賓,顧林玲. 近年來全球向日葵種植面積及農藥使用市場與品種[J]. 現代農藥,2018,17(1):16-18.
[2]鄭永杰,伍艷芳,李 江,等. 樟樹NBS-LRR類抗病基因家族分析與CcRNL基因克隆[J]. 生物技術通報,2018,34(2):142-149.
[3]Liu J L,Liu X L,Dai L Y,et al. in the , and of genes in [J]. of and ,2007,34(9):765-776.
[4]Bent A F. Plant genes: meets [J]. The Plant Cell,1996,8(10):1757-1771.
[5] E, F L. , of plant [J]. in Plant ,2009,12(4):427-436.
[6]森曉紅. 向日葵NBS型抗銹病相關基因的克隆與分析[D]. 呼和浩特:內蒙古農業大學,2014.
[7]李 蓉,謝析穎,王雪晶,等. 蘭科植物FNR基因的密碼子偏好性分析[J]. 熱帶作物學報,2018,39(6):1137-1145.
[8] P,Basak S,Ghosh T C. codon usage of and - genes of rice and [J]. DNA ,2008,15(6):347-356.
[9]Liu Q P. bias and the codon usage of - genes in rice[J]. PLoS One,2012,7(10):.
[10]Ahmad T, G, T V,et al. of codon in and based on and frame tags[J]. DNA ,2013密碼子使用偏性,20(2):135-150.
[11]續 晨,蔡小寧,錢保俐,等. 葡萄基因組密碼子使用偏好模式研究[J]. 西北植物學報,2012,32(2):409-415.
[12]曲俊杰,黃 羽,盧 江,等. 香蕉基因組密碼子使用偏好性分析[J]. 南方農業學報,2017,48(1):14-19.
[13]陳 哲,胡福初,王祥和,等. 菠蘿密碼子使用偏好性分析[J]. 果樹學報,2017,34(8):946-955.
[14] H,Gouzy J, C J,et al. The into oil , and [J]. ,2017,546(7656):148-152.
[15]Sharp P M,Li W H. The codon index:a of codon usage bias,and its [J]. Acids ,1987,15(3):1281-1295.
[16]Ma Q P,Li C,Wang J,et al. of codon usage in FAD7 genes from plant [J]. and ,2015,14(1):1414-1422.
[17]Novoa E M. Lluís ribas de . with :codon usage,tRNAs,and [J]. in ,2012,28(11):574-581.
[18]胡振民,萬 青,李 歡,等. 茶樹.1基因密碼子使用特性分析[J]. 江蘇農業學報,2019,35(4):896-903.
[19]馮瑞云,田 翔,程 宏,等. 蒙古黃芪異黃酮合成酶基因密碼子偏好性分析[J]. 山西農業科學,2019,47(3):297-303.
[20]孫繼峰,韓太利,徐立功,等. 蘿卜ICE1密碼子使用偏性分析[J]. 核農學報,2018,32(3):477-485.
[21]馬盛超,余鑫梅,姚慧鵬. 蓼科大黃屬植物CHS基因密碼子偏愛性分析[J]. 分子植物育種,2017,15(6):2171-2178.
[22]李國靈,陶 文,高詩晨,等. 紅藻rbcL基因密碼子偏愛性分析[J]. 分子植物育種,2020,18(1):109-117.
[23]方 輝,曲俊杰,孫嘉曼,等. 香蕉全基因組NBS抗病基因密碼子使用偏好性分析[J]. 分子植物育種,2017,15(3):883-889.
[24]張曉峰,薛慶中. 水稻和擬南芥NBS-LRR基因家族同義密碼子使用偏好的比較[J]. 作物學報,2005,31(5):596-602.
[25]陳觀水.甘薯抗病相關基因的克隆與分析[D]. 福州:福建農林大學,2007.