论文部分内容阅读
棉花是全球性的重要经济作物之一,植物学分类属于被子植物门(Angiospermae)、双子叶植物纲(Dicotyledoneae)、锦葵目(Malvales)、锦葵科(Malvaceae)、棉族(Gossypieae)、棉属(Gossypium)。棉属共50个种,包括45个二倍体及5个四倍体种。四倍体棉种包括3个野生棉,即毛棉、黄褐棉及达尔文氏棉,此外陆地棉和海岛棉是目前世界上栽培面积最广的两个栽培种。栽培种由野生种驯化而成,由于长期栽培、驯化及选择作用,野生棉伴随着对光周期敏感的多年生短日照生长习性转变为光周期不敏感的一年生生长习性。发掘棉花光周期相关基因,研究光周期开花途径的作用机制,对于棉花适应多样性的环境及种植面积的扩展十分有益。CO(CONSTANS)及COL(CONSTANS-LIKE)基因是调控植物光周期开花的一个重要转录因子。CO受上游生物钟相关基因(GIGANTEA)G1的影响,并激活下游的成花素FT(FLOWERING LOCUST)的表达.对于特定基因或位点的选择作用,会导致栽培种群体内核酸多样性水平降低、基因频率的降低或升高而偏离中性期望及连锁不平衡的增加。目前水稻中已经证明COL基因是选择的靶标基因。鉴于COL家族基因在光周期开花途径中的保守功能,棉花中COL家族基因信息的局限性以及驯化选择中作用未知。本研究根据拟南芥、水稻的COL家族基因信息从全基因组水平分离棉花的COL家族基因,对其进行分类、结构特征、定位、组织表达、昼夜节律表达及分子进化等系统分析,主要研究结果如下:1.利用比较基因组学,根据拟南芥、水稻的COL家族基因信息,比较雷蒙德氏棉数据库,鉴定了23个棉花COL家族基因。根据系统进化分析,该家族基因分为3类,其中Ⅰ类基因包括COL1-8,均含有两个外显子和一个内含子。AA分析显示有2个B-box及1个CCT结构域(COL8除外);Ⅱ类基因包括COL9-11,也包含两个外显子和一个内含子,有1个B-box及1个CCT结构域;Ⅲ类基因包括COL12-23,该类基因包含一个完整的B-box,一个分化的锌指结构及一个CCT结构域。该类基因结构比较多变,包括2个或3个内含子。2.利用实时荧光定量PCR技术,研究了20个COL家族基因在棉花TM-1根、茎、叶、花药、花瓣等不同组织及0DPA、10DPA及20DPA纤维发育不同阶段的表达特性。结果显示,Ⅰ类中的八个基因中,COL1-5,COL8等六个基因在叶中高表达,COL6和COL7在花中优势表达。此外,COL2-5在纤维中表达也较高。Ⅱ类中三个基因均在叶中优势表达。Ⅲ类中九个基因,除COL14、COL20及COL22分别在茎、叶及纤维中优势表达外,其余六个基因均是组成型表达。3.在LD或SD条件下,分别处理陆地棉TM-1及海岛棉H7124,连续48h取三叶一心期叶片进行COL家族基因表达特征分析。结果显示已分析的20个基因中有18个基因的表达表现为昼夜节律性,表明棉花COL家族基因参与棉花光周期调控的开花途径,在棉花的光周期开花途径中起重要作用。4.选择包括野生棉、陆地棉及海岛棉等25个棉材料及外类群长梗肖槿为研究材料,对CO/Hd1所在的Ⅰ类中8个基因进行分子进化相关分析。通过各基因基因组与cDNA进行多序列比对分析,结果表明这8个COL基因非常保守,均含有两个外显子和一个内含子。8个COL基因其DNA全长变异范围为1,030bp-1,611bp,内含子长度的变异范围为77bp-680bp。通过比较不同棉种间同一亚组其同源基因的变异发现,COL2,COL6,及COL8在供试材料间的内含子或外显子Ⅱ区发生插入/缺失,导致长度变异。而同一材料其A-及D亚组部分同源基因的结构变异表明,COL4和COL7在外显子Ⅰ或外显子Ⅱ发生插入/缺失,导致At及Dt间长度变异。5.系统进化分析表明,A组供体阿非利加棉与异源四倍体棉A亚组聚在一起,D组供体与异源四倍体棉D亚组聚为一类。184个成对比较中,其A vs.D、At vs.Dt成对比较的进化速率高于A vs.At及D vs.Dt进化速率占到98.37%。进一步分析证明A vs.D与At vs.Dt进化速率之间表现极高的正相关,最小的相关系数r值为0.797。说明异源四倍体中,8个COL家族基因的A-及D-亚组间是独立进化的。6.通过成对比较8个COL家族基因组合,以及每个基因在所有四倍体棉种及A、D基因组间的核酸多样性(π)。结果表明8个基因组合中,D vs Dt核酸多样性(0.01051),显著大于A vs At的核酸多样性(0.00586)(P=4.9E-21)。单个基因分析表明,COL2-COL5,COL7及COL8这6个基因在Dt中的进化速率显著快于At,COL6是在At的进化速率显著快于Dt,而COL1基因的进化速率在At和Dt之间无显著差异。综上所述,8个COL家族基因在At及Dt间的进化速率不同,大部分基因其Dt的进化速率快于At。7.分别分析野生棉、陆地棉及海岛棉的8个COL基因位点其核酸多样性πtotal,结果显示野生棉的πtotal,显著高于陆地棉(0.00369 vs 0.00139)(P=0.001)及海岛棉(0.00369 vs 0.00035)(P=7.3E-7),表明陆地棉及海岛棉在驯化过程中存在瓶颈效应。进一步比较B-box,Var及CCT这三个结构域在不同棉种中的核酸多样性,发现B-box(0.00284 vs 0.00119,P=0.028)及Var(0.00243 vs 0.00119,P=0.014)结构域的核酸多样性显著高于CCT结构域,B-box及Var结构域间的核酸多样性无显著差异。说明B-box及Var结构域在进化过程中发生较大变异,而CCT结构域在不同棉种间高度保守,功能上也比较保守。8.通过对8个COL家族基因进行Tajima’s D,Fu and Li’s D和F中性检验,表明陆地棉在COL1及COL2中存在大量的低频率位点,这与陆地棉最近发生的正选择作用相一致。COL8Dt在陆地棉种中,Fu and Li’s D和F值在0.1水平上为显著的正值,表明在COL8中存在大量中等频率的等位基因,可能是由平衡选择引起的。中性检验表明,COL1、COL2及COL8在陆地棉的驯化过程中经受了更大的选择压,可能是受选择的靶标候选基因。