我有一些非常大的文件,其中包含基因组位置(位置)和相应的群体遗传统计(值)。我已成功绘制了这些值,并且希望为顶部5%(蓝色)和1%(红色)的值进行颜色编码。我想知道如果有一个简单的方法R.做到这一点基于ggplot百分位数的颜色代码点
我已经探讨写作然而定义位数,函数,其中许多人最终被不唯一,从而导致功能失败。我也研究过stat_quantile,但只使用它来绘制标记95%和99%的一条线(并且一些线对角线对我没有任何意义),但只有成功。(对不起,我是新来的R.)
任何帮助将不胜感激。
这里是我的代码:(该文件非常大)
########Combine data from multiple files
fst <- rbind(data.frame(key="a1-a3", position=a1.3$V2, value=a1.3$V3), data.frame(key="a1-a2", position=a1.2$V2, value=a1.2$V3), data.frame(key="a2-a3", position=a2.3$V2, value=a2.3$V3), data.frame(key="b1-b2", position=b1.2$V2, value=b1.2$V3), data.frame(key="c1-c2", position=c1.2$V2, value=c1.2$V3))
########the plot
theme_set(theme_bw(base_size = 16))
p1 <- ggplot(fst, aes(x=position, y=value)) +
geom_point() +
facet_wrap(~key) +
ylab("Fst") +
xlab("Genomic Position (Mb)") +
scale_x_continuous(breaks=c(1e+06, 2e+06, 3e+06, 4e+06), labels=c("1", "2", "3", "4")) +
scale_y_continuous(limits=c(0,1)) +
theme(plot.background = element_blank(),
panel.background = element_blank(),
panel.border = element_blank(),
legend.position="none",
legend.title = element_blank()
)
p1
如果您提供数据,您会发现更快,更好的响应。显示你如何得到'fst'没有帮助,因为我们没有任何你的起始数据。你可以用'dput()'发布你自己的一些数据,或者创建一个最小的虚拟集。 – alexwhan
接受问题答案并不好,然后决定在一个月后更改问题,不接受答案并修改您的问题 - 这完全违背了存档问答格式的目的。如果您有新问题,请发布新问题!最好的办法是扭转你的编辑,重新接受答案,并发布你的新问题。 – alexwhan
对不起alexwhan!我对这个问答格式不熟悉,并且认为如果它具有可接受的答案,就不会看到编辑。我没想过把它作为一个新问题发布。 – ONeillMB1