2016-07-27 65 views
0

我现在正在做EdX的Spark课程简介。 是否有可能在我的电脑上保存来自Databricks的数据框。如何将数据从数据框导出到文件数据块

我问这个问题,因为这个课程提供Databricks笔记本这可能不会在课程结束后的工作。

在笔记本数据导入使用命令:

log_file_path = 'DBFS:/' + os.path.join( 'databricks-数据集', 'CS100', '实验2',“数据-001' , 'apache.access.log.PROJECT')

,我发现这个解决方案,但它不工作:

df.select( '年', '模式')。 write.format('com.databricks.spark.csv')。save('newcars.csv')

回答

0

试试这个。

df.write.format("com.databricks.spark.csv").save("file:///home/yphani/datacsv") 

这会将文件保存到Unix服务器中。

如果你只/家/ yphani/datacsv它看起来对HDFS的路径。

3

Databricks运行云虚拟机并不知道您的本地计算机所在的位置。如果您想保存DataFrame的CSV结果,则可以运行display(df),并且可以选择下载结果。

enter image description here