我有这个简单的卡夫卡流 val messages = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](ssc, kafkaParams, topicsSet)
// Each Kafka message is a flight
val flights = messages.map(_._2
我正在寻找最佳的解决方案来积累Spark DStream中最后N个消息。我还想指定要保留的消息数量。 例如,给出下面的流,我想保留最后的3个要素: Iteration New message Downstream
1 A [A]
2 B [A, B]
3 C [A, B, C]
4 D [B, C, D]
到目前为止,我期待在上DSTREAM以下方法: