2014-09-29 113 views
1

我一直在Scala中使用Spark。我现在正在研究pySpark和SparkR。我没有看到为PySpark和SparkR提到的流式传输。是否有人知道在使用Python和R时是否可以使用Spark流?sparkR流媒体?

回答

1

目前(自Spark 1.1起),Spark Streaming仅在Scala & Java中受支持。如果您想要使用特定的R程序或Python程序,则可以查看RDD上的管道接口以及DStream上的转换函数。这有点尴尬,但它可能是目前在Spark Streaming中使用Python或R代码最简单的方法。

+1

Spark Streaming的Python支持应该很快添加!有一个开放的拉请求:https://github.com/apache/spark/pull/2538 – 2014-10-01 00:50:19