1
这是我的代码
Sys.setenv('SPARKR_SUBMIT_ARGS' =
'"--packages" "com.databricks:spark-csv_2.10:1.3.0" "sparkr-shell"')
library(SparkR)
sc=sparkR.init(master="local",
sparkHome = "/Users/devesh/Downloads/spark-1.4.1-bin-hadoop2.6",
sparkPackages = c("com.databricks:spark-csv_2.10:1.3.0"))
sqlContext <- sparkRSQL.init(sc)
df <- createDataFrame(sqlContext, iris)
avg(df$Sepal_Length)
,给我的输出:
Column avg(Sepal_Length)
但不是数。我正在使用Mac OS
我试着用你的suggestion-我得到以下输出错误:所有选择()输入必须解决整数列位置。 以下不要: * avg(df $ Sepal_Length) – Devesh
您的工作区中显然有些混乱:)这是'dplyr'错误,而不是SparkR。 – zero323
谢谢你现在的作品! – Devesh