0
我已经添加下面给我的脚本:星火未压缩JSON输出
val conf = new SparkConf
conf.set("spark.hadoop.mapred.output.compress", "true")
conf.set("spark.hadoop.mapred.output.compression.codec", "true")
conf.set("spark.hadoop.mapred.output.compression.codec", "org.apache.hadoop.io.compress.GzipCodec")
conf.set("spark.hadoop.mapred.output.compression.type", "BLOCK")
我写这样df.write.json("out")
数据。但是,我所得到的只是输出中的.json文件,而不是预期的.json.gz。这里有什么问题?
可能是您正在使用过时的属性:https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/DeprecatedProperties .html – pzecevic
感谢您的想法,但更改为新的属性并没有帮助。 – Dmitri