【问题标题】:How would YOU compute IMDB movie rating?您将如何计算 IMDB 电影评分?
【发布时间】:2011-04-12 16:03:54
【问题描述】:

我这样做只是为了学习目的。我无意颠倒 IMDB 的方法。

我问自己我拥有 IMDB 或类似网站。如何计算电影评分?

我能想到的只有加权平均(这不过是算术平均值

对于下面提供的电影数据,计算将是

(38591*10 + 27994*9 + 32732*8 + 17864*7 + 7361*6 + 2965*5 + 1562*4 + 1073*3 + 891*2 + 3401*1) / 134434 = 8.17055953


我的评分 8.17055953 与 IMDB 评分不匹配(=加权平均)。所以我的结论是我在这里遗漏了一些东西,或者我的分数不是一个理想的分数。我可能会错过很多东西。

  1. 我的分数有什么问题?为什么不理想?
  2. 如果你必须计算。你会怎么做?

【问题讨论】:

  • Everyone: claws 询问顶部/底部列表的排名机制。这个问题是关于 IMDb 如何将算术平均值转换为加权平均值。以“马诺斯:命运之手”为例——未加权平均为 2.1,加权平均为 1.5。 (或“教父”,选票填充的另一个例子。)

标签: math statistics imdb weighted-average


【解决方案1】:

不完全是主题,但对你有用:

How the ranking is calculated.

希望对你有帮助。

附:此页面已确认:

IMDB Chart

【讨论】:

  • 我发现 Wikipedia 页面有点难以理解(不是精算师),但在 IMDB 页面底部有一些东西 - 在 Top 250 页面底部写着“真正的贝叶斯估计”和提供与维基百科相同的公式......我发现这个页面更容易阅读:wiki.answers.com/Q/…
  • 这篇文章不那么啰嗦,而且更容易理解,感谢您的链接:)
【解决方案2】:

首先:您的计算(这是一个un加权平均值,或简单的平均值)有一个错字:您有19562'4'评级,但您应该有1562。更正此结果为 ~8.17,与 IMDB 的算术平均值相同。

接下来,如果您确实想要一个加权平均值,那么您需要一些可以衡量的东西!因此,例如,如果用户有“声誉”或类似的(甚至只是注册的时间长度),您可以将其用作他们评分权重的乘数。最后,除以权重总和而不是总票数,得到加权平均值。

可能需要某种重量的比例因子 - 例如,如果 SO 做了这样的事情,Jon Skeet 的观点可能有点不公平,要承受 20 万倍的重量新注册用户的意见:)

【讨论】:

    猜你喜欢
    • 2022-01-18
    • 2020-03-18
    • 2013-01-08
    • 1970-01-01
    • 1970-01-01
    • 2017-09-17
    • 2019-06-25
    • 2022-08-14
    • 1970-01-01
    相关资源
    最近更新 更多