2
我有一个并行度为8的DataStream。我将两个接收器添加到DataStream中。一个很慢(Elasticsearch),另一个很快(HDFS)。但是,我的事件只会在被刷新到ES后写入HDFS,因此ES需要的时间比无ES的时间要长。如何在Apache Flink中并行写入接收器
dataStream.setParallelism(8);
dataStream.addSink(elasticsearchSink);
dataStream.addSink(hdfsSink);
在我看来,这两个汇使用相同的线程。是否可以通过使用与两个接收器相同的源,或者是否必须添加另一个作业(一个用于earch接收器)以并行写入输出?
我检查了Map(1/8)到Map(8/8)正在部署和接收数据的日志。
考虑到背压使我趋向于同一个方向,谢谢澄清。 –