1
我有一个流式管道,它使用带时间戳标记的事件。我想要做的就是将它们批处理为1分钟的固定窗口,然后将窗口中的所有事件写入单个GCS文件。我可以使用FixedWindows
,除了从文档中,我可以看到我需要一个GroupBy
或Combine
操作来应用窗口,但对于我的用例,Windowing已经完成了我需要的所有分组。我看到这个两个可能的解决方案,这两个我不知道是理想在没有GroupBy的情况下对数据使用FixedWindows
- 推动这些项目到一个单一的
GlobalWindow
和重复应用1分钟触发,丢弃解雇窗格。我还没有尝试过这一点,我不知道这是否会工作没有一个组 在
FixedWindow
之后运行全球Combine
- 我不确定这是否仍然会考虑windows。这些是正确的选择还是有更好的办法?
感谢