0

我正在为项目到项目推荐电影制作在线引擎。我已经做了一些研究,我认为最好的实现方法是使用皮尔森相关,并使用item1,item2和相关字段创建一个表格,但问题是在项目的每个速率之后,必须重新生成相关性在最坏的情况下N个记录(其中N是项目的数量)。如何优化数据库建议引擎

另一个想法是我读的是following文章,但我没有想到实现它的方法。

那么你有什么建议来优化这个过程?还是有其他建议? 谢谢。

回答

0

这种“购物车”问题的当前方法是使用奇异值分解(SVD)。 NetFlix Prize的前三名参与者都使用了SVD。 SVD用于对庞大产品*个人协方差矩阵进行“降维”。好消息是增量方法(向数据集添加一些观察值并不意味着重新计算整个矩阵)。

0

没有最佳解决方案,但您可以通过在Stack Overflow上查看“协作过滤”标签或“推荐引擎”标签找到很多建议。