0
选项是否DataFrameReadercsv(路径:字符串)跳过空白行
org.apache.spark.sqlDataFrameReadercsv(path: String)
有跳过空白行的选项?特别是,最后一行是空行吗?
选项是否DataFrameReadercsv(路径:字符串)跳过空白行
org.apache.spark.sqlDataFrameReadercsv(path: String)
有跳过空白行的选项?特别是,最后一行是空行吗?
你可以尝试设置mode
到"DROPMALFORMED"
为:
val df = sqlContext.read.format("com.databricks.spark.csv").option("mode", "DROPMALFORMED")...
在Python
:
df = sqlContext.read.format('com.databricks.spark.csv').options(mode = "DROPMALFORMED")...
其中根据documentation:
"...drops lines which have fewer or more tokens than expected."
现在我得到这个错误: va lue选项不是org.apache.spark.sql.DataFrame的成员 –
我认为上面使用了Python语法。对于Scala,请使用spark.read.option(“mode”,“DROPMALFORMED”)。csv(path) –