2017-03-15 103 views

回答

2

Flink目前(2017年3月,Flink 1.2)不支持为流提供机器学习模型。但是,这是社区目前正在讨论的功能。

随意在Flink提交JIRA以请求该功能。

在Flink提供官方支持之前,可能还有其他方式将模型加载到Flink中。 (免责声明:我真的不是Spark ML的专家)。 从JavaDocs看来,CrossValidatorModel有一个方法write(),它返回MLWritersave(String path)方法。

您可以在Spark中构建模型,使用MLWriter保存模型,然后使用MLReader在Flink中再次加载并在流中使用它。

+0

Flink是否支持读取Spark模型?如果不是,Spark阅读器和'transform'都需要一个功能性的Spark群集...导出为某种独立于平台的格式可能是更好的选择。 – zero323

+0

回答你的问题:not yet :)你能推荐一个独立的格式吗? –

+1

[(J)PMML](https://github.com/jpmml/jpmml-spark)上次检查时工作得相当好。 [MLeap](https://github.com/combust/mleap)很有趣,但我不确定它是如何与Flink一起使用的。这一切我知道现有的尝试。 [PFA](http://dmg.org/pfa/)很有前途,并且有[初始Java实现](https://github.com/opendatagroup/hadrian)。 – zero323

相关问题