我正在试验一些电影评级数据。目前正在做一些混合项目和基于用户的预测。在数学上,我不确定如何实现我想要的,也许答案只是直截了当的权重,但我觉得可能有其他选择。加权平均值趋于中心
我有4个值,现在,我想基于
- 项目预测的平均
- 基于用户的预测
- 全球电影平均为给定项目
- 全球用户平均给定用户
由于这个progesses我会需要添加其他值,如加权simil arity,流派权重和我相信其他一些事情。
现在我想集中讨论如上所述的可用数据,以便理解为其他任何内容。
这是我的理论。要开始,我想要权衡项目和基于用户的预测,这将比全球平均值更重。
虽然我觉得我的生锈的数学和一些基本的尝试提出一个不太线性的解决方案是使用像谐波的意思。但并非天然地倾向于低平均值倾向于全球平均值。
如
预测项目基地评级4.5
预测基于用户评价2.5
全球电影分级3.8
全球用户评分3.6
因此“中心“/全球平均在这里将是3.7
我可能会离开基地,因为我的数学是相当生疏,但任何想法如何我可以用数学表示我在想什么?
OR
你有不同的做法
netflix奖由“分层”SVD算法赢得。 – wildplasser 2012-02-23 00:03:13
事实上,在那个时候我有点不在。为了学习的目的,我正在尝试这条路线,看看我能够走多远。我看了SVD,但还不确定我可能会如何实现它。 – 2012-02-23 00:14:04