生物信息学学习笔记(四)

mark

最近看了华中农业大学张献龙老师发在Nature Genetics上的文章 Asymmetric subgenome selection and cis-regulatory divergence during cotton domestication以及第一作者王茂军博士的博士毕业论文,十分精彩,故学习之并做适当笔记。

  • 通过分析四倍体棉花At和Dt亚组同源基因甲基化和表达量之间的关系,推测不同亚组基因的表观修饰差异可能是基因偏向性表达的原因之一

  • 部分名词解释:

    • H3K27me3:组蛋白H3上第27位赖氨酸三甲基化
    • H3K4me1:组蛋白H3上第4位赖氨酸一甲基化
    • H3K4me3:组蛋白H3上第4位赖氨酸三甲基化
    • H3K9me2:组蛋白H3上第9位赖氨酸二甲基化
  • 不同作物基因组大小差异非常大,这主要是由于重复序列和转座子的插入与丢失造成的。对于二倍体来说,不同作物基因数量与基因组大小并不显著相关,基因数量一般在3万到4万之间

  • 不同作物生物学特性与其对应的基因的扩增与丢失,基因表达的差异有关

  • 同一作物的不同材料之间基因组序列变异非常大,因此需要测序群体基因组去研究

  • DNA甲基化是一种重要的表观调控机制。在植物中发生在胞嘧啶上的DNA甲基化主要存在三种形式:对称形式的CG,CHG和非对称形式的CHH(H=A,T或者C)

  • 植物种DNA甲基化主要发生在转座子区域和其他高度重复序列区域

  • 组蛋白修饰是另外一种非常重要的表观遗传修饰,参与异染色质区域转座子的失活调控,同时调控植物发育和环境响应相关途径。组蛋白甲基化存在于赖氨酸和精氨酸上,通过依赖组蛋白赖氨酸甲基转移酶和精氨酸甲基转移酶建立,这些酶都被称为写入器,组蛋白甲基化之后能够被特定蛋白识别,然后参与不同生物学过程的调控,这些识别蛋白被称为阅读器。组蛋白甲基化的存在是动态的,可以被一些蛋白清除,这些蛋白被称为清除器

  • DNA甲基化和组蛋白修饰在基因上的分布和对基因表达的影响 mark

  • 利用DNase Ⅰ酶切染色质并收集酶切片段进行测序(DNase-Seq),可以高通量鉴定顺式调控元件。DNase-Seq可以用于鉴定DNase Ⅰ酶切超敏感位点,这些位点通常对应顺式调控元件。DNase Ⅰ酶切位点不是均匀的,被转录因子结合的位点会阻止酶切,这些位点的酶切效率很低。通过分析DNase Ⅰ酶切足迹,可以在单核苷酸水平鉴定转录因子结合位点

  • 顺式作用元件调控基因转录的模式图

mark

除了启动子区域外,增强子是另外一种重要的顺势调控元件。DNase-Seq鉴定的DHS包含大量增强子区域,增强子能够招募装录因子,从而促进靶标基因的表达,这种作用常常以细胞特异或组织特异的形式存在。增强子的作用与靶标基因的物理位置和方向关系较小,因此增强子元件可以位于基因组的不同位置。

  • 基因表达的可变剪接是在pri-mRNA水平进行的能增强蛋白多样性的一种机制。可变剪接事件可以分为五种基本类型,包含内含子保留(IR),外显子跳跃(ES),可变供体(AD),可变受体(AA)和可变位置(AP),其中IR在植物中占据绝大部分
  • 祖先染色体构建

为了分析驯化选择在不同亚基因祖上的差异性,构建棉花的At和Dt亚组的祖先染色体。因为两个亚组的基因组大小差异巨大,在构建祖先染色体的时候,只使用了共线性区段的基因对。共线性区段是通过MCScanX软件鉴定出来的,规定最小共线性区段必须包括5个基因。同时将两个亚组的基因做相互blastp分析,保留最好的匹配结果。结合共线性区段和blastp的结果,得到最终的亚组之间的同源基因。这些同源基因必须同时被这两种方法检测。提取这些同源基因上下游2kb的区段与基因区域一起构建祖先染色体。祖先染色体上的基因顺序依据于Dt亚基因祖上的基因排列顺序

  • 可以通过DNase-Seq测序鉴定棉花基因组上的顺式调控元件主要是根据顺式调控元件通常位于开放的染色质区域,很容易被核酸酶切
Researcher

I am a PhD student of Crop Genetics and Breeding at the Zhejiang University Crop Science Lab. My research interests covers a range of issues:Population Genetics Evolution and Ecotype Divergence Analysis of Oilseed Rape, Genome-wide Association Study (GWAS) of Agronomic Traits.

comments powered by Disqus