全基因组加倍及串联重复基因
串联重复基因是植物基因组中一类具有功能的串联重复序列,在植物基因组进化和环境适应的过程中起着十分重要的作用。串联重复基因主要是由串联重复事件产生的。在植物基因组中,串联重复事件的发生频率比较高,为植物基因组带来了基因拷贝数的增加以及等位基因变异。串联重复事件伴随着拟南芥和芸薹属物种的整个进化过程,而且芸薹属物种的多倍化事件并没有影响串联重复事件的发生。
- 基因共线性分析
拟南芥在进化过程中先后经历了三次基因组加倍事件(α、β和γ多倍化事件)。通过对拟南芥基因组的三次基因组加倍事件产生的共线性基因对分析,获得了α、β和γ多倍化事件后分别产生的3530,1421和505共线性基因对。在拟南芥细胞色素P450基因家族的进化分析发现,仅有CYP94基因家族中一对基因在γ基因组加倍化事件后产生的共线性基因对中被保留下来。这可能意味着CYP94基因家族的这两个成员在双子叶植物的祖先在经历γ基因组多倍化事件之前就存在。对于β基因组多倍化事件,CYP86、CYP72和CYP81基因家族中各有一对基因对被检测到保留下来,这意味着这些P450基因在β基因组多倍化事件之前就存在并在β基因组多倍化事件之后被保留下来。对于α基因组加倍事件产生的共线性基因对,共获得了11个P450基因对在α基因组加倍化事件后被保留下来,意味着这22个P450基因在α基因组多倍化事件之前就已存在并在α基因组加倍事件后保留下来。
在拟南芥和芸薹属的祖先物种分化之后,芸薹属祖先物种经历了自身的三倍化事件,然后进一步产生了现在的白菜和甘蓝,通过与拟南芥基因组中24个十字花科保守区段的共线性关系构建了白菜和甘蓝基因组中的三倍化区段。根据三倍化区段上基因密度的差异,两个芸薹属物种中的三倍化区段划分为三个亚基因组:MF1(中度丢失)、NF2(高度丢失)和LF(低度丢失)。
-
通过古基因组学研究可追溯源到由7931条原基因模型和7条染色体构成的双子叶植物祖先基因组,以及由9138条原基因模型和5条染色体构成的单子叶植物祖先基因组。显花植物研究表明,被子植物基因组经历二倍化(α)、四倍化(β)和六倍化(γ)3次古全基因组复制(WGD)事件。
-
同源多倍体来源于种内WGD事件,异源多倍体来源于种间杂交。芸薹属(Brassica)植物经历了3次基因组WGD事件(α、β和γ)和种系全基因组三倍化事件,是基因组多倍化研究的重要模式物种。