我有其中有一些多线观察一个数据帧:如何处理火花多行的行?
+--------------------+----------------+
| col1| col2|
+--------------------+----------------+
|something1 |somethingelse1 |
|something2 |somethingelse2 |
|something3 |somethingelse3 |
|something4 |somethingelse4 |
|multiline
row | somethings|
|something |somethingall |
我要的是在csv
格式(或txt
)这个数据帧进行保存。使用以下内容:
df
.write
.format("csv")
.save("s3://../adf/")
但是,当我检查文件时,它将观察结果分离为多行。我想要的是具有'多行'观察值的行在txt/csv文件中是同一行。我试图将其保存为txt文件:
df
.as[(String,String)]
.rdd
.saveAsTextFile("s3://../adf")
但是观察到相同的输出。
我可以想象,一种方法是用其他东西替换\n
,并且在加载后执行反转功能后。但是有没有一种方法可以在不对数据进行任何形式的转换的情况下以预期的方式进行保存?