我遇到过很多情况,我想绘制的点数比我真正应该达到的要多 - 主要的缺点是,当我与人分享我的情节或将它们嵌入到论文中时,它们占据了太多的空间。在数据框中随机抽样行非常简单。R中的最大绘图点数?
,如果我想为一个点的情节真正的随机样本,可以很容易地说:
ggplot(x,y,data=myDf[sample(1:nrow(myDf),1000),])
不过,我想知道是否有更有效的(理想罐装)的方式来指定的积点的数量这样你的实际数据就能准确地反映在情节中。所以这里是一个例子。 假设我正在绘制诸如重尾分布的CCDF之类的东西,例如,
ccdf <- function(myList,density=FALSE)
{
# generates the CCDF of a list or vector
freqs = table(myList)
X = rev(as.numeric(names(freqs)))
Y =cumsum(rev(as.list(freqs)));
data.frame(x=X,count=Y)
}
qplot(x,count,data=ccdf(rlnorm(10000,3,2.4)),log='xy')
这将产生y轴变得越来越密的图。在这里,为较大的x或y值绘制较少的样本是理想的。
有没有人对处理类似问题有任何提示或建议?
感谢, -e
您好罗布,德克 - 我要澄清的是我不寻找一种方法来处理使用不同可视化方法的重叠绘图。我特别想做一个情节点,我可以在一个乳胶纸作为嵌入一个可伸缩矢量图形。我想这样做的方式是减少传达我的数据所需的绘图点数。 – eytan 2009-12-26 15:18:46
然后子采样可能是你最好的选择。当然可以用“非均匀”采样来完成,所以你可能想从尾部保持更多的点(甚至全部),但能买得起变薄的主要部分显着。但这看起来有问题,所以你可能不得不自己做饭。 – 2009-12-26 17:37:20