2010-09-15 76 views
4

我这样做只是为了学习的目的。我无意扭转IMDB的方法。你会如何计算IMDB电影评级?

我问自己我拥有IMDB或类似的网站。我将如何计算电影评级?

所有我能想到的是加权平均(这是什么,但算术平均值

对于下面的计算提供了一个电影数据将

(38591 * 10 + 27994 * 9 + 32732 * 8 + 17864 * 7 + 7361 * 6 + 2965 * 5 + 1562 * 4 + 1073 * 3 + 891×2 + 3401 * 1)/ 134434 = 8.17055953

alt text


我的评级8.17055953与IMDB评分(=加权平均)不符。所以我的结论是我在这里错过了一些东西,或者我的分数不是一个理想的分数。我可能缺少很多东西。

  1. 我的分数有什么问题?为什么它不理想?
  2. 如果你必须计算。你会如何做到这一点?
+1

所有人:爪子是*不*询问的排名机制,顶/底上市。这个问题是关于IMDb如何将算术平均值转换为加权平均值。以“马诺斯:命运之手” - 未加权平均值2.1,加权平均值1.5。 (或“教父”,另一个选票馅的例子。) – 2010-09-15 12:55:45

回答

4

首先是:计算(这是一个加权平均,或简单平均)有一个错字:你有19562“4”的收视率,但你应该有1562。对此进行修正得到〜8.17,其与IMDB的算术平均值相同。

接下来,如果你确实想要加权平均值,你需要一些权重!因此,例如,如果用户具有“声誉”或类似(甚至只是注册时间的长度),则可以将其用作评级权重的乘数。最后,除以权数的总和而不是总票数,并且你有一个加权平均数。

可能需要某种重量的比例因子 - 例如,如果SO做了这样的事情,Jon Skeet的意见可能会带来二十万次的重量,注册用户的意见:)

+0

该死的错字! – claws 2010-09-15 12:50:28

7

不完全的话题,但对您有用:

How the ranking is calculated.

希望帮助

P. S.这证实了这一页上:

IMDB Chart

+0

我发现维基百科页面有点难以消化(不是精算师),但是在IMDB页面的底部 - 在顶部250页的底部,说“真正的贝叶斯估计”,并提供与维基百科相同的公式。 ...。我发现这个页面有点容易阅读:http://wiki.answers.com/Q/What_does_true_Bayesian_estimate_mean_in_connection_with_the_IMDb_Top_250_ratings – 2010-09-30 13:12:25

+0

这是一个不太罗嗦和更易于理解的文章,感谢您的链接:) – Dave 2010-10-04 08:30:42