0
我想按年/月/日划分数据帧。我还想删除任何空白分区,并将输出保存在我的本地计算机下,如年/月/日等文件夹下。Spark如何根据年份和月份划分数据帧
我已经尝试了以下,但它仍然创建200奇怪的分区。
val sqldf = spark.sql("SELECT year(EventDate) AS Year_EventDate, month(EventDate) as Month_EventDate FROM table CLUSTER BY Year_EventDate,Month_EventDate")
sqldf.write.format("com.databricks.spark.csv").option("header", "true").mode("overwrite").save(destinationFolder)
它为我工作。谢谢 – jane