2017-11-10 197 views
-1

我完全新的Web服务的独立,我想创建它是这样一个Web服务:创建点播阿帕奇星火网络服务

用户输入一些字到网页。 Apache Spark作业在后端启动,它将这些词作为输入参数使用 该作业的结果将被处理并显示回网页。 我想让它成为一个独立的产品,而不使用任何Spark-as-a-service服务,例如Bluemix等

现在,我正在考虑采用类似这样的方式:后端的Python服务器接受请求并输入新的Spark作业。当spark工作完成时,Python服务处理输出并将其发送回页面。

我不知道这是否是最好的方式去做这件事。另外,我不确定如何在网页中实时显示Spark作业的进度。

+0

你想处理多少数据? –

回答

1

apache livy项目可能适合您的需求。

https://livy.incubator.apache.org/

李维使提交经由REST接口或一个RPC客户机库中使用同步和异步结果火花。

希望得到这个帮助!