我试图从我的本地文件夹读取和写入数据,但是我的数据不完全相同。将值保存在spark中
val data =sc.textFile("/user/cts367689/datagen.txt")
val a=data.map(line=>(line.split(",")(0).toInt+line.split(",")(4).toInt,line.split(",")(3),line.split(",")(2)))
a.saveAsTextFile("/user/cts367689/sparkoutput")
输出:
(526,female,avil)
(635,male,avil)
(983,male,paracetamol)
(342,female,paracetamol)
(158,female,avil)
如何节省输出如下,需要卸下支架。
预期结果:
526,female,avil
635,male,avil
983,male,paracetamol
342,female,paracetamol
158,female,avil
您正在保存元组对象的RDD到一个文件,所以是的,你会得到括号。你有没有试图创建一个数据框并保存? –