13
火花的1.5.0似乎可以编写自己的UDAF的对DataFrames定制的聚合: Spark 1.5 DataFrame API Highlights: Date/Time/String Handling, Time Intervals, and UDAFsPython API中提供了Spark SQL UDAF(用户定义的聚合函数)吗?
如果此功能是Python API所支持然而我不清楚?
火花的1.5.0似乎可以编写自己的UDAF的对DataFrames定制的聚合: Spark 1.5 DataFrame API Highlights: Date/Time/String Handling, Time Intervals, and UDAFsPython API中提供了Spark SQL UDAF(用户定义的聚合函数)吗?
如果此功能是Python API所支持然而我不清楚?
您无法在Spark 1.5.0-2.0.0中定义Python UDAF。有一个JIRA跟踪此功能要求:
解决了与目标“后”,所以它可能不会很快出现。
您可以从PySpark使用Scala的UDAF - 它被描述Spark: How to map Python with Scala or Java User Defined Functions?
不,它不支持。你可以打电话给斯卡拉UDAF,但它不漂亮。查看[我的答案](http://stackoverflow.com/a/33257733/1560062)[Spark:如何将Python与Scala或Java用户定义的函数进行映射?](http://stackoverflow.com/q/33233737/ 1560062)为一个完整的例子。 – zero323
@ zero323现在1.6 spark还是1.61? – stackit
@stackit不是1.6.x也不是2.0。 – zero323