豆瓣电影评分模型是什么?可信吗?
一:豆瓣评分是谁做的?
很多颁奖场合包括“专家评审团”和“大众评审团”。豆瓣没有专家评审,但有一亿多人的大众评审团。
豆瓣注册用户看完一部电影,心情好的话会过来打一颗到五颗星(有时候心情不好也会过来)。比如一部电影有42万用户。我们的程序把这42万个一到五的星转换成零到十,加起来除以42万,得到豆瓣评分。这个评分会自动出现在豆瓣各处,中间没有审核,平时也没有编辑盯着。每隔几分钟,程序就会自动运行一次,包括最新评分者的意见。
这42万用户可能包括资深影评人,你,你的亲人,你的小学同学,早上卖给你油条的人,还有安倍本人。但是每个人都有一票。这就是“大众评审团”应该有的含义:不是所有的评审团成员都是大众,而是和大众一样一人一票。
当豆瓣的工作人员意外收到“我给这部片子打了五星的评价,为什么评价一点都没变”的投诉时,他们会(或者说应该)耐心解释评价其实变了,除了嘟囔一句“哎,你们这些红人/独生子女/数学差的人怎么办?”
“一人一票”唯一的例外是豆瓣的节目判定是“异常评分”账号。这些分数将被排除。细节会在下面提到。
豆瓣电影评分的主题和原则是“尽量还原普通观众对一部电影的平均看法”。这个主题过去十年没有变,未来也不会变。
不是专家、影视从业者或资深人士对电影的看法,虽然这些看法会被豆瓣算作“普通观众”。所以,有一次听到“豆瓣电影不专业”的说法,我的反应是“大众不专业”,语言要怪。个人觉得总结专家意见会是另一项有价值的服务,但这真的不是豆瓣评分的目的。
第二:豆瓣评分是否反映了文艺青年的喜好?
不再是了。
可能早些年吧,因为来上档次的人中文艺的比例比街上的高。但是现在每个月都有1亿人在用豆瓣。我觉得我们的文艺青年没有变得那么厉害。基本可以确定现在豆瓣评分反映了民意。只是这个“大众”更集中在一二线城市,这和豆瓣用户扎堆的地方是一致的。
换句话说,在所有去电影院看电影的“人”和所有看电视的“人”中,目前(2015)在豆瓣评分的人,更接近去电影院的人。
有些独立电影只有年轻艺术家来看,所以他们从年轻艺术家那里得到一个平均分。你不文艺,只是因为你得了高分,然后……你不能怪豆瓣,更不能怪他们。但是很多事情就是这样。打分只是判断的一部分,往往更重要的是“听”和“选”。这个下面也会提到。
三:为什么我喜欢/讨厌/拍摄/执导/投资的电影/电视剧在豆瓣上获得异常低/高的评分?
所有电影都有难以调音的问题。最好的不是所有人都喜欢的,所有人都喜欢的也不是最好的。
当人在感情上卷入一件事,或者有了明确的爱恨情仇,就会投射到别人身上,认为别人也应该有同感。所有父母都知道这一点。“别人”凑在一起就成了“大多数人应该”或者“正常人应该”。我们看到同样的感觉就觉得好,看不到就不能一下子接受。你我这样,没什么好奇怪的。
在评分这件事上,看到评分和自己的想法一致,觉得豆瓣比较靠谱。看到了不一致,觉得豆瓣不靠谱。这种反应也是正常的。但“豆瓣”背后只是多了很多“别人”,不多也不少。你平均不同意别人的意见,你就可以静下心来下结论。不一定是别人不正常,背后也不一定有阴谋。这不一定是坏事,大众往往是错的,至少你有意见。
我也是一个创作者,做过一些不靠谱的互联网产品。我很清楚我是多么希望和相信我的作品出来后别人会喜欢。事实是,很难把握自己和他人的喜好,难免碰壁,但下一次我们会“爱上自己的作品”。这是创造的代价,是我们自找的,也是我们对它着迷的原因之一。
四:水军怎么了?豆瓣评分可以刷吗?
有水军,但是豆瓣评分难刷。
电影行业大了,奇怪的事情就多了。我们把“我还是不相信,所以我准备把提高/降低平均分动机下的评分行为称为“异常评分”,或者说评分的目的是直接干扰平均分。在我个人的印象中,“异常评分”大致有四类:注册/收购账号评分高的,注册/收购账号评分低的(这个我看不懂),有明星粉丝群体“攻击豆瓣”的,有死忠用户“捍卫豆瓣公正评分”的逆水。应该还有别的,比如行为艺术。
以上听起来很吓人,但对豆瓣评分的影响其实没那么大,小影响还是短暂的、个别的。因为正常评分的人太多,也因为反评分早已是豆瓣电影日常工作的一部分,所以很多同事一直在用更多的程序默默做着。
豆瓣这两年的原则是“凡是能判定为分数异常的都不算”,不分高低贵贱。(捍卫评分公平的用户。我真的很抱歉也很感激。但这应该是我们的工作,而不是所有人的,一时做不好是我们的失职。)。
“不算”很简单,可操作性强,但是“判断是异常分数”就没那么直接了。豆瓣一代又一代的算法工程师、程序员、编辑、产品经理都在这件事上贡献了自己的才华,最后都实现了24小时运行的大大小小的程序。这确实是一件持续而神奇的事情。但是现在门槛已经很高了,声称可以刷分的基本都是骗人的。
在评分基本无效后,干扰豆瓣评分的努力正在演变为“社会工程”:制造豆瓣评分对特定影片有问题的舆论,试图从整体上攻击豆瓣评分的可信度,或者直接对豆瓣工作人员施加心理压力。行业瞬息万变,不知道未来会变成什么样,但是豆瓣自己的想法和立场可以保持不变。
五:有没有一劳永逸彻底解决水军问题的方法?
可能没有一劳永逸的解决办法。不过说到底还是有办法让水军跳进去,让得分的湖一点波纹都没有,不过可能会对正常得分用户的感受有轻微影响。我们正在积极准备,必要时可以推出。
六:怎么做才能让我的电影在豆瓣评分更高?
《人找豆瓣》最没用。很多人都试过,大老板直接找到了我。江湖那么大,有用的话早就有人知道了。你可以四处问问。据我所知,整个豆瓣系统并没有“修改电影平均分”的后台功能。
上面说了,越来越没用了。所以我真的不知道除了拍好电影还能做什么。
但是最近一个转行做电影的老朋友问了我同样的问题。只要回答“拍个更好的电影就行”,他很可能会揍你一顿。于是我第一次站在电影的立场思考这个问题,答案依然是否定的。但我给出了一些观察,希望对他有用。以下是大致意思。
一部电影的豆瓣评分是由前来评分的人的平均意见决定的。按道理,平均来说,在其他条件相同的情况下,来看一部没有太多宣传的电影的人往往得分高,但人少;本来不喜欢,因为大规模宣传树立了很高的期望,我倾向于低分,但是人多。这也是为什么独立电影有时评价很高(只被粉丝评价),而票房奇迹有时评价很低(不喜欢的人也被推广)。
所以掌声和票房,高分和票房之间有一些本质的冲突,只有真正受欢迎的电影才能化解这种冲突。除了拍出更好的电影永远是王道,把握好宣传的度也很重要。过度宣传可能会降低分数。
最后我问这位朋友:口碑和票房哪个对你更重要?他的回答吐血,这里就不赘述了。但是我觉得如果他的片子好,最后也不会是什么纠结的问题。
七:豆瓣电影评分和豆瓣电影业务有什么关系?
简单来说,没关系,我们也不想让它有关系。具体来说,可以分为当前业务和未来业务。
目前豆瓣来自电影行业的主要收入渠道是电影广告。形式是广告横幅,卖点是“让更多人知道你的电影/电视剧”。经常需要在电话里澄清“但是卖点不包括更高的分数”,我觉得同事也挺累的。这件事的收入只是豆瓣整体收入的零头。如果很容易误会,我们可以另做打算。
豆瓣会在电影行业争取更大的商机,只要不影响大众对豆瓣评分的信任。内部实现真正的独立相对容易,可以通过架构、系统、防火墙来实现。要避免市场和大众的认知容易被误导,或者说要避免被怀疑,难度略大。只要新的模式是依靠基于豆瓣整体数据的宏观判断,而不是直接依靠评分,我们相信很多事情都是可以做的,也想很快开始做。
从管理和团队一致性的角度来说,我在公司内部的各种场合和几百人的年会上都说过类似这个问答的话(需要简化,因为我要站出来说话),所以大部分同事都知道背离分级中立原则是极其严重的错误。在评分相关的事情上,我个人直到今天都没有发现本质的执行错误。更重要的是,如果过去或未来出现错误,豆瓣作为一家公司,有诚意和意愿保证在发现后能立即改正。
八:为什么这个时候出来写这个东西?
我们以前觉得提供分级服务中立独立是天经地义的,公开打广告也没什么。我们很少出来为有意无意曲解豆瓣评分原则的人辩护。我们觉得只要每个月有几亿人信任豆瓣,就够了。但是最近影视圈的变化让我们直接感觉到,这个时候保持低调可能是不明智的。
但我确实看到行业内的特定个体曾经都是有理想有抱负的年轻人,所以除了沟通失真和误解的原因,我也猜测行业正在催生一些结构性的问题。我直觉判断,今天可能是一个岔路口。现在有必要把豆瓣的立场表达清楚一次,避免炒作和误解导致的游戏把行业的角落推向最后我们不喜欢的方向。
豆瓣一直是用户的朋友,我们也希望它永远是影视行业的朋友。真的很想看到行业一直健康发展。我相信一个真诚中立的分级服务对整个行业都是长期有益的,我也相信一个透明传达观众观点的地方对个人在行业内的职业成长也会有微薄但长远的帮助。