2017-03-06 79 views
4

我想能够面对一个Rplotlyheatmap刻画一个阴谋热图

这里就是我的意思是: 我有一个分层聚类基因表达数据集:

require(permute) 
set.seed(1) 
mat <- rbind(cbind(matrix(rnorm(2500,2,1),nrow=25,ncol=500),matrix(rnorm(2500,-2,1),nrow=25,ncol=500)), 
      cbind(matrix(rnorm(2500,-2,1),nrow=25,ncol=500),matrix(rnorm(2500,2,1),nrow=25,ncol=500))) 
rownames(mat) <- paste("g",1:50,sep=".") 
colnames(mat) <- paste("s",1:1000,sep=".") 
hc.col <- hclust(dist(t(mat))) 
dd.col <- as.dendrogram(hc.col) 
col.order <- order.dendrogram(dd.col) 
hc.row <- hclust(dist(mat)) 
dd.row <- as.dendrogram(hc.row) 
row.order <- order.dendrogram(dd.row) 
mat <- mat[row.order,col.order] 

我则离散具体表达的范围,因为这正好帮助的颜色分辨率为我的情况。我还创建了另外的结构,以帮助我绘制colorbar我希望它的方式:

require(RColorBrewer) 
mat.intervals <- cut(mat,breaks=6) 
interval.mat <- matrix(mat.intervals,nrow=50,ncol=1000,dimnames=list(rownames(mat),colnames(mat))) 
interval.cols <- brewer.pal(6,"Set2") 
names(interval.cols) <- levels(mat.intervals) 
require(reshape2) 
interval.df <- reshape2::melt(interval.mat,varnames=c("gene","sample"),value.name="expr") 
interval.cols2 <- rep(interval.cols, each=ncol(mat)) 
color.df <- data.frame(range=c(0:(2*length(interval.cols)-1)),colors=c(0:(2*length(interval.cols)-1))) 
color.df <- setNames(data.frame(color.df$range,color.df$colors),NULL) 
for (i in 1:(2*length(interval.cols))) { 
    color.df[[2]][[i]] <- interval.cols[[(i + 1)/2]] 
    color.df[[1]][[i]] <- i/(2*length(interval.cols))-(i %% 2)/(2*length(interval.cols)) 
} 

他们这样,我产生的数据我知道样品1-500是一个集群和样品501:1000是其他的,所以我标号:

interval.df$cluster <- NA 
    interval.df$cluster[which(interval.df$sample %in% paste("s",1:500,sep="."))] <- "A" 
    interval.df$cluster[which(interval.df$sample %in% paste("s",501:1000,sep="."))] <- "B" 

我认为这增加了样品与不变色和间隔将创建在heatmap情节白色列会看起来像一个小边框:

divider.df <- data.frame(gene=unique(interval.df$gene),sample=NA,expr=NA,cluster=NA) 
interval.df <- rbind(dplyr::filter(interval.df,cluster == "A"),divider.df,dplyr::filter(interval.df,cluster == "B")) 

现在我尝试绘制:

#add ticks for each cluster 
tick.vals <- c("s.158","s.617") 
tick.text <- c("A","B") 

require(plotly) 
plot_ly(z=c(interval.df$expr),x=interval.df$sample,y=interval.df$gene,colors=interval.cols2,type="heatmap",colorscale=color.df, 
          colorbar=list(title="score",tickmode="array",tickvals=c(1:6),ticktext=names(interval.cols),len=0.2,outlinecolor="white",bordercolor="white",borderwidth=5,bgcolor="white")) %>% 
    layout(xaxis = list(title = 'Cluster',tickmode = 'array',tickvals = tick.vals,ticktext = tick.text)) 

但我没有看到集群之间的分离: enter image description here

任何想法如何实现两个集群之间的这种小的边界?

+0

您是否尝试过使用'plotly :: subplot'?我还注意到你的* y轴不是有序的,你打算如何解释你的热图? –

+0

这只是一个例子,所以我不打扰在这篇文章中的代码中订购y轴。实际上它会经历一个集群部分。我还没有试过这个副剧场选项。会尝试 – dan

回答

3

您的示例非常有用,因此我将它简化为一个最小示例,以便关注您在热图的象限中寻找的差距。

情节网站,here的实例修改。

library(plotly) 

m <- matrix(rnorm(9), nrow = 3, ncol = 3) 

p <- plot_ly(
    x = c("a", "b", "c"), y = c("d", "e", "f"), 
    z = m, type = "heatmap" 
) 

subplot(p, p, p, p, shareX = TRUE, shareY = TRUE, nrows = 2) 

如果每个象限的创建plotly对象,然后使用subplot,你会得到一个结果来看与此类似:

enter image description here

注:我已经裁剪出这个传说,因为它是为了方面而重复的,你可以将它们合并成一个。