Transposable Elements

TEsorter:转座子分类

简介 TEsorter是基于保守蛋白结构域以及 REXdb数据库进行分类。TEsorter不仅仅可以对LTR-RTs进行分类,还可以对其它Class Ⅰ以及Class Ⅱ等类型的TE进行分类,只要 REXdb数据库覆盖了的TE都可以分类,具体如下:

构建Consensus sequence

简介 Consensus sequence又称为一致性序列、保守序列、共有序列等。维基百科的解释: In molecular biology and bioinformatics, the consensus sequence (or canonical sequence) is the calculated order of most frequent residues, either nucleotide or amino acid, found at each position in a sequence alignment.

EDTA:转座子注释

简介 转座子注释目前有非常多的软件,而EDTA(The Extensive de novo TE Annotator)整合了大部分目前常用的转座子注释软件,值得注意的是EDTA是全基因组从头注释。EDTA最大的好处就是简单实用,而且经过大量的改进,目前在安装、运行以及结果解释等方面十分完善。

Nature Reviews Genetics | 测序时代的基因组转座子

简介 许多物种的基因组大部分是来自于转座子(Transposable elements, TEs)。此外,通过各种自我复制机制,TEs在大多数物种基因组中持续增殖。TEs会影响调控、转录以及新蛋白形成进而与性状比如疾病相关联。尽管TE表现出了显著的影响,但是很多基因组研究还是将它剔除在外,这主要是由于它具有高度的序列重复性,导致研究变得十分复杂。幸运的是随着大量的方法以及计算机软件的开发,TE的研究逐渐深入。本综述总结了TE研究的相关计算工具并着重指出了未来的TE研究存在的挑战与空白。对TE进行基因组上全面的分析不仅仅是“掩盖”这些重复序列(This Review presents a summary of computational resources for TEs and highlights some of the challenges and remaining gaps to perform comprehensive genomic analyses that do not simply “mask” repeats)。