回答

0

可以节省使用S3A://方案和Hadoop的API文件系统,如东西有点像

val fs = FileSystem.get("s3a://bucket1/dir", sparkContext.hadoopConfiguration) val out = fs.create("dest/mydata", true) out.write(" whatever, I forget the API for OutputStreams, it takes byte arrays really") out.close()

它可以是一个有点棘手设置CLASSPATH,但一切应设置在HDP为此。更确切地说,如果不是的话,我可以去支持电话:)