Spark Kafka与Apache Ignite的结构化流式集成

-5

现在，我无法在Apche Ignite中保存Spark DataFrames。它将包含在Apache Ignite 2.2版本中，如https://issues.apache.org/jira/browse/IGNITE-3084所述。我正在使用Apache Spark的结构化流式API与Kafka一起使用数据。我想要做一些聚合，如特定列的平均值或消耗数据的最小 - 最大值。Spark Kafka与Apache Ignite的结构化流式集成

我的问题是我是否应该使用Spark SQL DataFrame API来完成上面提到的聚合，还是应该等待Apache Ignite 2.2版本？他们在文档中提到Ignite SQL比Spark SQL快100倍。

2017-08-08 Sachin

其实，这取决于你。您现在可以继续使用Spark，然后等待Ignite准备好DataFrames支持，比较这两种方法并选择更适合您需求的方法。

2017-08-08 14:13:44 alexfedotov

回答