阅读拼花我写这段代码火花上保存和HDFS
val inputData = spark.read.parquet(inputFile)
spark.conf.set("spark.sql.shuffle.partitions",6)
val outputData = inputData.sort($"colname")
outputData.write.parquet(outputFile) //write on HDFS
如果我想读取HDFS文件“OUTPUTFILE”的内容,我没有找到相同的分区数和数据未被排序。这是正常的吗?
我使用的Spark 2.0
你如何检查分区的数量和阅读文件的内容?你使用show()或者take()来显示内容吗? –