我用pysparkpyspark MLUtils saveaslibsvm只有在_temporary保存和不保存在主
并使用MLUtils saveaslibsvm保存一个RDD上labledpoints
它的工作原理,但会保留在/ _temporary在所有工作节点的文件/尽可能多的文件。
没有错误抛出,我想将文件保存在正确的文件夹中,并最好将所有输出保存到位于节点或主服务器上的一个libsvm文件。
这可能吗?
编辑 ++++++++++++++++++++++++++++++++++++++++++++ +++++++++++++++++++++++++ 无论我做什么,我都无法使用MLUtils.loadaslibsvm()从相同的位置加载libsvm数据我用来保存它的路径。写这个文件可能有问题吗?