0
尝试使用写入方法将数据集/数据帧保存为hdfs的拼图。 HDFS中的部分内容是空的,但数据为空。我使用的Spark版本 - 2.X在火花数据集写入HDFS期间创建的空白部分
dataset.write.mode("append").partitionBy("empNo").format("parquet").save("hdfs path")
或
dataset.write.mode(SaveMode.Overwrite).save("hdfs path")
请建议
你为''HiveContext'设置'dynamic.partition'为'true'和'dynamic.partition.mode'为'nonstrict'? – philantrovert
No.But这个写操作是否需要从spark到hdfs? – Abhi
对不起,我看错了你的问题。我以为你正在将分区数据写入配置单元表。 – philantrovert