2011-03-07 119 views
0

我有一个有两列的表,它们都是连续数据。我检查了csv文件以确保这些列中只有数字值。然而,当我绘制他们其中一人似乎被视为非连续的数据,我也得到:Error: Non-continuous variable supplied to scale_x_continuous. 这是我的桌子的小版在ggplot2中提供给scale_x_continuous的非连续变量geom_point图

budget gross 
1 234  4234 
2 42342  2323 
3 22165  346 
4 290  452 
... 

我想创建一个散点图,其中总数在y轴上,预算在x轴上。 我试过这个,但我得到了前面提到的错误。

p <- ggplot(test, aes(Budget, Gross))+geom_point(alpha=I(1/5), aes(colour=Budget))+ opts(titles="Movies per Year", panel.grid.major = theme_blank(), panel.grid.minor = theme_blank())+scale_x_continuous() 

谢谢你这么多

+0

您的数据包含专栏预算和毛额,但您对ggplot的调用使用标题案例版本 - 但这不是导致错误的原因。 +1的因子理论由马特 – mdsumner 2011-03-07 04:11:56

+1

有什么在data.frame使'read。*'函数认为列是一个因素。如果您使用的是Excel或OOCalc,那么可能有值前面有“'”(或其他一些污染物) - 如果您可以在线发布文件,我很乐意看看它)。他们可能会出现价值观,但他们不是。我总是主张一个清洁的数据框架,但这只是我的迂腐的一面而已。 – 2011-03-07 07:49:43

回答

2

尝试class(test$Budget)。赔率是R认为你的专栏是一个因素。如果是这样的话,你可以通过使用stringsAsFactors选项得到解决此问题,您read.csv()任内:

test <- read.csv(file = "yourdata.csv", stringsAsFactors = FALSE) 

或将其设置为整个会话:

options(stringsAsFactors = FALSE) 

从个人的经验,我d推荐后者。我以这种方式启动我的所有脚本 - 实际上,大多数需要因素的函数会根据需要强制使用其他矢量类型,如果它们不这样,我将手动指定它。但是拥有一大堆潜藏在你数据中的载体会让你头痛不已。

相关问题