0
我正在玩使用apache toree scala noteabook的结构化流式传输,并且希望创建一个总结(按组计数)我的数据并将总结输出到实木复合地板文件的数据框。 但我看到的都是空文件。这里是我的笔记本的相关代码:使用结构化流式输出聚合数据到实木复合地板使用结构化流式输出
val streamingCountsDF =
streamingInputDF
.withWatermark("timestamp", "1 week")
.dropDuplicates("timestamp","request")
.groupBy($"request",window($"timestamp", "1 hour"))
.count()
streamingCountsDF.isStreaming
val query = streamingCountsDF
.writeStream
.format("parquet")
.trigger(Trigger.ProcessingTime(10.second))
.option("path",parquetOutputPath)
.option("checkpointLocation","s3://mypath")
.outputMode("append")
.start()
任何想法我失踪?