我有这样的代码:取N行,并传递给toPandas()
l = [('Alice', 1),('Jim',2),('Sandra',3)]
df = sqlContext.createDataFrame(l, ['name', 'age'])
df.withColumn('age2', df.age + 2).toPandas()
做工精细,做什么需要的地方。假设我只想显示前n行,然后调用toPandas()
来返回一个熊猫数据帧。我该怎么做?我不能拨打take(n)
,因为这不会返回数据帧,因此我无法将其传递给toPandas()
。
换句话说,如何从数据框中获取前n行并在结果数据框上调用toPandas()
?不能认为这很难,但我无法弄清楚。
我正在使用Spark 1.6.0。
看我知道这很容易:)非常感谢。 – jamiet
欢迎您! – Neo