我想知道,当执行在缓存是一个过滤RDD犹若我们进行以下说明:上缓存RDD
val rdd : = sc.textFile("myfile").zipwithIndex.cache
val size = rdd.count
val filter = rdd.filter(_._2 % 2 == 0)
val sizeF = filter.count
在过滤器上执行的操作RDD是执行,如果它是在高速缓存或不是?尽管我们从第一个RDD创建了第二个RDD,但信息来自同一个地方,所以我想知道它是否被复制到需要缓存的新对象中,或者如果过滤对象直接链接到了其父项允许更快的行动?