Brassica

NP|油菜泛基因组及生态型分化

1. 简介 油菜(Brassica napus)是世界上重要的油料作物,起源于地中海地区,大约是在7500年前由白菜(Brassica rapa)和甘蓝(Brassica oleracea)自然杂交加倍形成的异源四倍体。与白菜以及甘蓝的大量杂交,极大地扩宽了油菜的遗传多样性。为了适应自然季节变化比如春化需求、耐冬性以及光响应开花,油菜形成了不同的生态型:冬性油菜(WORs)、半冬性油菜(SWORs)以及春性油菜(SORs)。目前油菜已经公布了4个版本的参考基因组(冬油菜:Darmor-bzh,Tapidor以及半冬油菜:ZS11,NY7)。但是由于测序方法或者测序深度的限制,已公布的基因组的准确度以及完整度都不足以支撑结构变异(SV)的研究,而结构变异往往决定了遗传多样性以及重要的农艺性状。泛基因组(pan-genome)指的是一个物种所有基因的集合,包括核心基因集(core genes)以及非必需基因集(dispensable genes)。多个高质量的参考基因组有利于油菜基因组结构研究以及探究油菜不同生态型分化的遗传基础。

油菜形成、进化及基因家族概况

起源 十字花科祖先于2400-4000万年前出现,然后拟南芥与芸薹属在1200-2000万年前分化,之后不久芸薹属经历了特有的基因组三倍化,而后又经历了大规模的基因丢失、基因获得和包括部分复制和部分丢失的染色体重排。芸薹属两个重要的二倍体基本种白菜油菜(AA,2n=20)与甘蓝(CC,2n=18)于460万年前分化。甘蓝型油菜是由白菜型油菜和甘蓝通过种间自然杂交后又经染色体加倍而形成的一个异源四倍体。因此甘蓝型油菜基因组中通常会含有2个或2个以上的重复基因序列。

油菜形成、进化及基因家族概况(三)

同源基因 同源基因包括直系同源基因(Orthologs)和旁系同源基因(Paralogs)。 直系同源基因 直系同源基因是指分布于两种或两种以上物种的基因组中,在进化上起源于一个祖先基因并垂直传递的同源基因,直系同源基因之间的功能高度保守,有些近乎相同。 旁系同源基因 旁系同源基因是指同一基因组(或同系物种的基因组)中,由于祖先基因的基因复制产生的同源基因。旁系同源基因尽管在结构上具有一定程度的相似性,但是他们的功能可能相似,也可能并不相似,甚至失去功能变成了假基因。

油菜形成、进化及基因家族概况(二)

基因家族 由一个共同的祖先基因经过重复(duplication)和突变(mutation)产生的、外显子中具有相似的序列的一组相关基因称为基因家族(gene family)。基因重复主要有三种形式:片段复制、串联重复和逆转录转座或其它转座事件等,基因重复后可以彼此形成基因簇(gene clusters),同一家族中的成员有时紧密排列在一起成为一个基因簇;更多时候他们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有不同的表达调控模式。