2016-07-25 68 views
0

几个问题:预测IO - 管理或清除事件

  1. 假设我训练PIO系统与一群事件,但后来我发现,我的事件是错误的出于某种原因,我我希望系统在下一次训练时忽略或删除这些事件。我怎么做,而不删除我的应用程序的整个数据库?

  2. 流入PIO服务器的事件加起来数十亿美元。你是否必须定期从系统中删除旧事件,如果有,如何?你直接针对HBase运行查询还是有特殊的PIO命令?

  3. 在安装过程中,我看到的是PIO同时使用HBase的弹性和搜索。它在Elastic Search中存储了什么?

代码示例会非常有帮助。 谢谢。

+0

你使用哪种版本PredicionIo的? (apache或actionml)和哪个模板? –

回答

1

我想你问的通用模板。

  1. 您可以更改engine.json并删除这些事件类型。所以你有效地忽略了。
  2. 请参阅 - eventWindow中here
  3. Hbase用于保存事件数据,而elasticsearch用于保存项目的元数据。你可以在配置文件中看到这个pio-env.sh

请注意,这个通用模板版本(0.3.0)需要ActionML fork版本0.9.6中的PredicitionIo。

+0

谢谢。我还想问问是否有办法在多个PIO服务器之间分配存储和计算负载。我无法找到说明如何在任何地方做到这一点。 –