0
我有型Seq[Seq[(Double, Double)]]
的变量:如何使用期望RDD [(Double,Double)]作为Seq [Seq [(Double,Double)]]的输入的函数?
val output: Seq[Seq[(Double, Double)]] = runStreams(ssc, numBatches, numBatches)
现在我想申请功能RegressionMetrics
这需要RDD[(Double, Double)]
作为输入:
val metrics = new RegressionMetrics(output)
如何变换Seq[Seq[(Double, Double)]]
到RDD [(双人间, Double)]`为了能够使用类RegressionMetrics的函数?
好的,谢谢。我正在使用Seq进行测试。那么,我是否理解正确,如果使用磁盘上存储的一些数据,我可以将它读入RDD并替换Seq? – Klue
正确!对于测试 - 首先,您可以使用Spark的本地模式轻松创建独立的SparkContext;其次,实际上你可以按照这里所建议的使用'parallelize',或者直接通过'SparkContext.textFile'从文件中加载数据 –