2011-10-03 111 views
1

我在玩Mahout的推荐引擎,并且遇到了使用genericdatamodel对象的问题。我的问题是,如果我想将一些新用户数据添加到现有的数据模型中,则是通过重新读取所有数据重建新数据模型的唯一方法。Mahout的GenericDataModel数据模型

当前,我们的数据在缓存中。

回答

1

是的,这是正确的。它的性能是有效的只读。一般的想法是,你不会频繁地合并数据模型更新,因为它通常意味着重建许多其他预先计算或高速缓存的计算。

你可以破解它暴露一个更新方法没有太多的麻烦。只要注意线程安全问题。

+0

肖恩,谢谢你回答这个问题。我对Mahout框架非常陌生。当你提到黑客更新方法时。你的意思是破解库中的数据模型或我自己的更新来推送新的数据集。我猜是datamodel上的refresh()调用不适用于添加新的数据集。 –

+0

我的意思是修改'GenericDataModel'代码本身。是的,这个想法一般是使用'refresh()'。 –