令人困惑的是,每个用于数据流的Google文档都说它现在基于Apache Beam,并将我引导到Beam网站。另外,如果我寻找github项目,我会看到谷歌数据流项目是空的,只是一切都去apache梁回购。现在说我需要创建一条管道,从我从Apache Beam读取的内容中,我会这样做:from apache_beam.options.pipeline_options
但是,如果我使用google-cloud-dataflow,则会出现错误:no module named 'options'
,事实证明我应该使用from apache_beam.utils.pipeline_options
。那么,看起来谷歌云数据流是与一个较旧的波束版本,并将被弃用?google-cloud-dataflow vs apache-beam
我应该选择哪一种开发我的数据流管道?