油菜形成、进化及基因家族概况(二)
基因家族
由一个共同的祖先基因经过重复(duplication)和突变(mutation)产生的、外显子中具有相似的序列的一组相关基因称为基因家族(gene family)。基因重复主要有三种形式:片段复制、串联重复和逆转录转座或其它转座事件等,基因重复后可以彼此形成基因簇(gene clusters),同一家族中的成员有时紧密排列在一起成为一个基因簇;更多时候他们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有不同的表达调控模式。
假基因
在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(pseudogene)。假基因与有功能的基因同源,原来可能是有功能的基因,但由于缺失、倒位或点突变,使这一基因失去活性,成为无功能基因。与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧具有顺向重复序列。据推测假基因的来源之一可能是基因经过转录后生成的RNA的前体通过剪切失去内含子形成mRNA,如果mRNA经反复转录产生cDNA,再整合到染色体DNA中,便有可能成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失、倒位或点突变等变化,从而使假基因不能表达。假基因一般缺乏必要的启动子序列和缺乏一个或多个具有活性的成员中特有的内含子序列。
DNA重复
DNA重复通常是指DNA片段数的增加,它可以是一个完整基因的重复(基因重复)、基因的一部分重复、一个完整染色体的重复(非整倍体)或整个基因组的重复(多倍体)。基因家族是由于连续的基因重复所造成的。非整倍体常导致生物体不育,而基因组重复只是增加基因拷贝数,并不产生新的基因,对基因组的复杂性并没有改变。从基因组计划的角度来看,更多的是考虑单个基因或一些基因的重复,而不是整个基因组的重复。
超基因家族
多基因家族是一类具有序列同源性及功能相似性的基因;而超基因家族是一类具有序列同源性而不具有相似功能的基因。
基因簇
许多重要的基因家族在基因组中成簇存在,也即同一基因家族的不同成员在基因组中重复串联排列。这些成簇存在的基因是种系生殖细胞在减数分裂过程中通过染色体不等交换和基因转换形成的。成簇存在的基因(通常组成多基因家族)具有相似的功能,而分散存在的基因往往具有不同的功能,当然也有例外。分散存在的基因家族一般认为是通过RNA逆转录、随后整合到基因组中形成的。整合序列(integrated sequence)或逆转录序列(retrosequence)来源于基因的RNA转录本,因此无内含子。大多数逆转录序列变为不具功能的逆转录假基因(retropesudogene),只有极少数逆转录序列保留了功能。
基因家族形成的分子机制
- 基因重复和点突变
基因发生重复的主要分子机制包括多倍体化、串联重复及逆转录转座。多倍体化导致了许多基因家族的形成,串联重复参与了成簇存在的基因家族的进化,重复的DNA区域可以小于或大于一个基因的长度,但在基因家族的进化过程中,整个基因的重复尤为重要。在种系减数分裂过程中,染色体不等交换引起基因串联重复,一旦一个基因簇形成,不等交换率就会升高。在具有相似功能成员的多基因家族中,频繁的染色体不等交换导致了家族成员的协同进化。
- 自然选择和随机漂变
任何重复基因或多拷贝基因,如果被表达且具有功能,则正经历着纯化性自然选择(purifying selection),多拷贝基因的进化率比单个基因的突变率低很多。自然选择限制程度随基因冗余而减弱,只要有一个基因保留其功能,有害的突变就有可能富集。对于大对数基因家族来说,有害突变的积累可被纯化性选择阻止,纯化性自然选择可以检测到具有功能的完整基因的数目。使突变基因拷贝数增加或减少的协同进化有利于自然选择。 正向自然选择(positive selection)是在重复基因获得新功能时发生的。许多重复基因产生后加快了氨基酸的替代,氨基酸替代可以通过同义及非同义突变的频率进行估计。 基因重复的另一后果是基因表达模式的变化,也即多拷贝基因的功能特化或亚功能化。这种变化对于参与发育过程的转录因子及其他蛋白尤为重要,这类基因功能的变化与生物的形态学进化直接相关。