0
我已经创建了下面的示例RDD,获取独特的RDD串
val rdd = sc.parallelize(List(("[email protected]"),
("[email protected]"),
("[email protected]")))
//I used the following to split,
val rdd1 = rdd.map(_.split("@")) //RDD[Array[String]]
什么我想现在要做的是得到一个新的RDD具有不同的区域,即
val finalrdd = sc.parallelize(List(("domainA"),
("domainB")))
我发现this post但我无法让它工作。