dataflow

0热度

1回答

我有一种情况，我需要将管道中的主数据流（1.5TB）连接到2个不同的数据集（4.92GB和17.35GB）。我用来为两者执行CoGroupByKey的关键是相同的。有没有办法避免在第一次完成后重新排列连接的左侧？目前我只是将输出作为KV>。这似乎比在第一次连接之后分段发射每个元素要好，但第二个groupByKey似乎仍然比我预期的要长很多。我打算开始考虑拆分CoGroupByKey，看看我是否可以

1热度

1回答

如何在LEVEL 3的表单提交中获得LEVEL 4的select元素值？

抽象出实际的复杂代码以使其更具可读性。在我们Angular 2的项目，我们有这样的组件<top-component>（LEVEL 1）： <top-component> </top-component> 它具有以下的模板：<some-form>（LEVEL 2）： <some-form> </some-form> 其中有以下模板（LEVEL 3）： <form #f="ngForm"

0热度

1回答

春季云数据流 - 无法从卡夫卡

转换邮件使用Spring云数据流的版本1.2.2具有以下配置： spring.cloud.dataflow.applicationProperties.stream.spring.cloud.stream.binders.kafka1.type=kafka spring.cloud.dataflow.applicationProperties.stream.spring.cloud.stream

0热度

1回答

英特尔TBB计算图：如何指定节点的输入队列容量

我正在寻找.NET TPL Dataflow库的C++模拟。在TPL数据流中，您可以指定块的容量选项的并行度&。如果该块的输入队列的大小达到它的容量，则相应的块的生成器的执行被挂起： var buffer = new BufferBlock<int>(new DataflowBlockOptions() { BoundedCapacity = 10 }); var producer = ne

0热度

2回答

使用DataFlow作业分区表加载

我想要读取文件，并根据文件字段中存在的日期值将其写入BigQuery分区表。例如如果文件包含7月25日和26日的两个日期，则DataFlow应根据文件中存在的数据将该数据写入2个分区。 public class StarterPipeline { private static final Logger LOG = LoggerFactory.getLogger(Starter

2热度

1回答

SSIS数据流任务和“混合”选择

无法继续工作。注意使用SQL Server 2000 DTS包可以很好地工作。 AXDB是外部服务器（SQL Server 2000 Enterprise），OLAP是本地数据库，SQL Server 2008 R2标准（olap是使用select语句获取日期以在外部SQL Server上传递）。添加服务器名称不起作用。服务器链接，如果它很重要，可能不是。如果我只是在那里写日期，而不是试图通过

-1热度

1回答

用于在气流上运行数据流作业的jar路径

首先，我是气流新手。我想要做的是使用气流运行数据流作业。搜索了很多链接，发现我们需要创建一个jar文件，然后使用airflow脚本我们可以运行它。有没有人知道这个罐子应放在哪里，意味着谷歌云桶或本地路径。我们可以通过气流直接运行模板吗？

0热度

2回答

SSIS不承认索引？

我在varchar列'A'上有一个非聚集索引的表。当我使用Order By A子句我可以看到它扫描索引并在几秒钟内给出结果。但是，当我使用排序组件列'A'，我可以看到它需要几分钟来排序记录。所以我明白，它不承认我的非聚集索引没有人有使用的SSIS指标而不是使用查询，而不是组件的任何想法？

0热度

1回答

airflow.exceptions.AirflowException：使用密钥文件时应该定义作用域

问题：使用airflow运行数据流作业时，出现错误，是否与我们提供的关键路径有关。如果是的话应该是正确的道路。错误： File "/usr/lib/python2.7/site-packages/airflow/models.py", line 1374, in run result = task_copy.execute(context=context) File "/usr/lib/pyt

1热度

1回答

将Java对象转换为BigQuery TableRow

我正在探索Google Cloud Dataflow。我想知道如果Java对象或JSON自动转换为TableRow是否可以完成。就像我们可以自动分析JSON到POJO类一样。我找不到相关信息。希望不要重复的问题。将不胜感激的任何信息！问候