我无法弄清楚如何使用Spark SQL将数据插入Hive表的静态分区。我可以使用这样的代码写入动态分区:使用Spark SQL将数据插入到静态Hive分区中
df.write.partitionBy("key").insertInto("my_table")
但是,我想不出如何将数据插入到静态分区。这意味着,我想定义整个DataFrame应该被写入的分区,而不需要将列添加到DataFrame。
我看到在 InsertIntoHiveTable类中提到的静态分区,所以我想它是支持的。有没有公共的API来做我想要的?
是你能够找到类似于任何API写入动态分区? – Explorer
不,我无法找到任何东西,最终将RRD注册为临时表并从中运行SQL INSERT。但是很多Hive代码已经在Spark 2.0中重写了,所以现在可能是可行的。 –