这节课是最后一节课,主要将如何绘制热图(heatmap)。实际上关于热图的绘制,我以前写了一篇博客: R语言学习笔记之热图绘制,里面写的十分详细。但是今天热图绘制主要利用一个新的R包ComplexHeatmap进行绘制。
这节课作者命名为"Tweaking everything in a plot"。主要是对图形细节进行优化,包括:
上次将Lesson 02&03一起讲解完了,在Lesson 04中主要解决下面几个问题
Lesson02主要讲了如何从Excel导入数据以及如何从UCSC、ENSEMBL和RENCODE上下载数据,因此我就将Lesson02并入Lesson03一起讲了。
老早之前就知道了这门课 Plotting in R for Biologists,一直没有去学习一下,最近花时间看了一遍videos,发现讲的很不错,虽然有一节有一知识点讲的不是很清楚。学了一遍之后记点笔记,这是lesson1的学习笔记。这一节主要讲了数据读取、快速绘图以及图形保存。
前面几节课绘制的图形只有条形图,但是我们科研过程中需要绘制各种各样的图形来展现我们的数据,这节课就主要讲一下利用ggplot2绘制各种图形,这也是ggplot2的魔力所在。相同的数据可以通过不同类型的图形来可视化。本节课主要将绘制以下几类图形:
这节课主要两个知识点,一个是图形分面,一个是图形嵌入。
GWAS研究中的曼哈顿图以及QQ图可以说是标配了,至于具体如何理解这两个图,可以参考我以前的博客。上周我利用自己的数据跑了个GWAS,我是利用GAPIT跑的,出的图感觉真心丑,大家可以看看:
Polycomb group(PcG)蛋白是一组通过染色质修饰调控靶基因的抑制子,从生化和功能上可以分为两个主要的核心蛋白复合体PRC1(Polycomb repressive complex 1)和PRC2(Polycomb repressive complex 2)。PcG蛋白家族是一类在进化上极为保守的转录抑制因子。
Pericentrometric区域是接近端粒的DNA序列,它们含有大量的重复片段即其进行拷贝的常染色质起源位置(euchromatic ancestral loci)非常相似的大量DNA序列,是基因组结构中迅速改变的区域。
ggmap允许用户从Google地图下载并绘制地图。并且ggmap完美契合ggplot2,因此经ggmap绘制的图形可以作为ggplot2的图层,进而在此基础上不断添加图形元素形成十分复杂的图形。ggplot2+ggmap是地理可视化的利器。