2016-09-16 86 views
4

我已经在本地安装了PredictionIO,使用通用建议模板对本引擎进行了培训,我根据自己的需求对其进行了修改,一切都很正常。在生产中使用PredictionIO

现在我知道这可以满足我的需求,但我希望将它部署到生产环境中,但不幸的是,没有太多有关它的文档。

理想情况下,我想将所有部署在AWS上的文档都有描述它的一部分,但是因为CloudFormation模板被禁用,所以无用。

我想使用也许使用泊坞窗来实现它,但是我认识不足对整个堆栈,并想了解以下信息:

  • 应该在哪里的数据储存在哪里?hbase似乎是“数据库”,将它放在与其他服务器(事件服务器,预测服务器)相同的服务器上并不危险吗?

  • 它是如何缩放的?我是否需要在负载均衡器后面运行PredictionIO的多个实例或足够吗?如果是的话,该如何实现?

  • 什么是良好的分布式架构?为了扩展,我敢肯定,我们需要将EventServer与PredictionServer分开,这样做的好方法是什么?

希望有人能帮助。谢谢。 Cyril

回答

3
  1. 数据应存储在哪里?

PredictionIO网站:

如果您决定HBase的安装到其他位置,则必须编辑 PredictionIO-0.10.0-孵化/ conf目录/ pio-env.sh和更改PIO_STORAGE_SOURCES_HBASE_HOME变量指向您自己的HBase安装。

在网页

对于生产部署还提到,运行一个完全分布式HBase的配置。

  1. 它是如何缩放的?

有一个在predition-io google group他们打破缩放成单独的部件一个伟大的答案

  • 有什么好的分布式架构?
  • ,以规模化,我敢肯定,我们需要将事件服务器从PredictionServer分开,什么是做到这一点的好办法吗?

    分离摄取层,处理层和服务层通常被认为是很好的做法,但您需要注意不要过度工程。这很大程度上取决于您的具体使用情况,不要忘记,您所做的每个分离都会给系统增加更多复杂性(部署,监控等)。