1
A
回答
0
看看the scaladocs - 我建议RDD[Row]
这里,这意味着你需要到那里。应该是最简单的makeRDD。您还需要一个对应于您的的模式,您可以使用directly pull from it。
......你是如何得到Array[Row]
的呢?如果你想整个数据框的子部分只使用limit
API
:
0
你不想这样做。
例子:
scala> val d=sc.parallelize(Seq((1,3),(2,4))).toDF
d: org.apache.spark.sql.DataFrame = [_1: int, _2: int]
scala> d.show
+---+---+
| _1| _2|
+---+---+
| 1| 3|
| 2| 4|
+---+---+
scala> d.limit(1)
res1: org.apache.spark.sql.Dataset[org.apache.spark.sql.Row] = [_1: int, _2: int]
scala> d.limit(1).show
+---+---+
| _1| _2|
+---+---+
| 1| 3|
+---+---+
不过,如果你想明确地将数组[行]到数据帧,你可以这样做
scala> val value=d.take(1)
value: Array[org.apache.spark.sql.Row] = Array([1,3])
scala> val asTuple=value.map(a=>(a.getInt(0),a.getInt(1)))
asTuple: Array[(Int, Int)] = Array((1,3))
scala> sc.parallelize(asTuple).toDF
res6: org.apache.spark.sql.DataFrame = [_1: int, _2: int]
,因此现在你可以相应地表现出来!
0
在我的回答中,df1是一个DataFrame [text:string,y:int],仅用于测试 - val df1 = sc.parallelize(List("a", 1")).toDF("text", "y")
。
val schema = StructType(
StructField("text", StringType, false) ::
StructField("y", IntegerType, false) :: Nil)
val arr = df1.head(3); // Array[Row]
val dfFromArray = sqlContext.createDataFrame(sparkContext.parallelize(arr), schema);
您也可以映射并行阵列投下的每一行:
val dfFromArray = sparkContext.parallelize(arr).map(row => (row.getString(0), row.getInt(1)))
.toDF("text", "y");
在一排的情况下,你可以运行:
val dfFromArray = sparkContext.parallelize(Seq(row)).map(row => (row.getString(0), row.getInt(1)))
.toDF("text", "y");
在星火2.0使用SparkSession代替SQLContext 。
0
如果您有List<Row>
,那么它可以直接用于使用spark.createDataFrame(List<Row> rows, StructType schema)
创建dataframe
或dataset<Row>
。火花2.x中SparkSession的位置
相关问题
- 1. 将数据帧转换为numpy数组?
- 2. 如何通过fucnction将数据组转换为数据帧
- 3. 将数据帧行转换为新的数据帧列R
- 4. 如何将长数据帧转换为宽重复数据/重复数据帧?
- 5. 如何使用Spark数据帧将行数据帧转换为数组Json输出
- 6. 优化:将数据帧拆分为数据帧列表,每行转换数据
- 7. 如何将xml数据转换为R中的数据帧
- 8. 如何将数据帧的第一行转换为列
- 9. 如何将数据帧行转换为标题?
- 10. 如何将行转换为火花数据帧中的列,scala
- 11. 如何编写将数据帧转换为另一个数据帧的函数?
- 12. 的Python:数据帧转换为元组
- 13. 如何SparkR数据帧转换为RDD
- 14. 如何转换为数据帧
- 15. 将N个数据帧转换为3个列数据帧
- 16. 将Spark数据帧转换为org.apache.spark.rdd.RDD [org.apache.spark.mllib.linalg.Vector]
- 17. 将Rdd转换为数据帧
- 18. 将数据帧转换为KEGGGraph
- 19. sparksql将数据帧转换为json
- 20. C# - 将R数据帧转换为Deedle.Frame
- 21. 将数据帧转换为xts
- 22. 将Pandas列转换为数据帧
- 23. 将数据帧转换为字典
- 24. 将文本转换为数据帧
- 25. 将Spark数据帧转换为Vector
- 26. 将两个数组转换为R中的一个数据帧
- 27. 将一个数据帧转换为矩阵或二维数组
- 28. 将两个numpy数组转换为数据帧
- 29. 将数据帧转换为字符数组?
- 30. 如何将绑定的数据帧转换为绑定的数据帧?
为什么downvote? 100%回答问题,测试和工作 –
同意,我甚至认为这应该是公认的答案 – belka
@BelkacemLahouel谢谢:)请投票,如果你发现它有帮助:) –