1
我试图在我的数据库上运行MLlib算法之一,即LogisticRegressionWithLBFGS。Apache Spark MLlib LabeledPoint空标签问题
该算法将训练集作为LabeledPoint。由于LabeledPoint需要双重标签(LabeledPoint(双标签,Vector特征)),而且我的数据库包含一些空值,我该如何解决这个问题?
在这里你可以看到一段代码与此相关的问题:
val labeled = table.map{ row =>
var s = row.toSeq.toArray
s = s.map(el => if (el != null) el.toString.toDouble)
LabeledPoint(row(0), Vectors.dense((s.take(0) ++ s.drop(1))))
}
和错误,我得到:
error : type mismatch;
found : Any
required: Double
不使用LabeledPoint我可以运行此算法或哪能克服这个“空值”问题?