为何说线上评价不公正,且容易被操纵

简介:

研究表明,线上评价是消费者在进行电子购物时最信任的消息源之一。但最近有调研显示,线上评价总体来说并不公正,而且很容易被操纵。


几个月前,我去纽约格林尼治村的 Dojo 餐厅吃东西。我对这家餐厅有自己的看法,毕竟我已经在那里吃过、体验过了。食物还行。服务也还行。总体而言就是不过不失。


于是我去 Yelp(译注:类似大众点评网的产品)给这家餐厅打分,我对于该打几星有明确的想法。我登录之后去到这家餐厅的页面,按下按钮,开始写评论。在打分按钮的右侧,我看到一位名叫 Shar H. 的用戶用优美的语言谈论着 Dojo 那“新鲜美妙的甜品姜饼塔”,在她的评论上方是闪闪发亮的五颗星星。


我动摇了。之前我觉得这家店可以打三星,但 Shar 说得有道理:“良心价格!”


她的评论影响了我。我最终给它打了四星。


我发现自己的行为并不少见。事实上,社交网站上他人的意见会极大地影响线上评分。而它却是最受电子商务消费者信赖的消息源之一。


羊群心态是问题所在

数字时代,他人的见解向洪水般涌来。我们在亚马逊浏览书籍时,同时面对着其他顾客对某本大作的好恶。我们在 Expedia 根据其他用户的评分选择酒店。我们在 YouTube 根据视频旁的那个竖起或向下的大拇指决定它是不是值得看。我们甚至会根据其他病人的反馈来形成对医学专业人士的意见。


在大多数情况下,我们对这些评分有信心,我们相信它。2012 年,尼尔森调查机构采访了 56 个国家的超过 28000 位网民,发现线上点评是第二类最受信任的有关品牌的信息(第一是朋友与家人的推荐)。根据这次调查,全球顾客中有超过三分之二表示他们信任这些线上平台中的信息,这一数字在四年中上升了15%。


但这种信任或许用错了地方。问题的核心在于我们的羊群心态──人类天然缺乏自主决策能力。羊群心态令我们和周围的人想得一样、做的一样。举例来说,2013 年 4 月里的两天,金价发生了三十年来从未有过的大跌。彼时,市场观察家们给出了各种各样的解释,但没有哪种解释特别具有说服力。“结论只能是:黄金投资者甩卖是因为看到其他投资者在甩卖──换句话说,是羊群心态在起作用,”英国《金融时报》的莎拉·哥顿写到。

0


社会压力造成的偏见


在羊群心态之外,还有我们对正向的“社会影响”的屈从。当我们看到别人欣赏一本书、享受一家酒店或餐厅、或是赞扬某个医生,并通过线上点评的方式对这些人或事物予以回报时,我们也会对这些书、酒店、餐厅或医生产生正面情绪,从而为它们在网上打出高分。


最近,我和两位同事一起设计了一个简单的随机化实验来研究某家社交新闻聚合网站。他们两人分别是耶路撒冷商业管理学院希伯来大学的高级讲师莱夫·穆许尼克和纽约大学斯特恩商学院的博士生肖恩·J·泰勒。(关于实验的详细信息请参看“关于本研究”。)用户可以在这家网站上根据自己的喜好给新闻报道与评论文章投支持或反对票。我们会通过投票随机地操纵分数。点向上的箭头表示“用户”喜欢这篇报道,点向下的箭头表示他不喜欢。接下来,我们测量了这些小规模的操纵对后续评分的影响。


结果令人惊讶。正面的操控在五个月时间里营造了正向社会影响,最终将整体评分提高了 25%。而负面的操控则受到“修正效应”的影响而被中和了:虽然用户看到负面评价也更容易打出低分(羊群效应),但他们看到自己觉得并没有那么差的新闻受到差评时会愿意“修正”这种评分。


这种社会压力造成的偏见会像滚雪球一样,导致不成比例的高分以及盲目的正面点评。我们对其进行了正面操控的点评最终达到或超过 10 分的几率比没有被操控的点评高出 30%。达到 10 分不是小事:那个网站的平均分数是 1.9。一票赞成影响的不仅仅是平均分,也会推高分数曲线最高的那一端。换言之,初始的一票赞成可以成就文章的热门地位。


盲目点评

最近有几个研究小组都发现了线上点评的盲目性,部分科学家称之为线上点评的“J 型分布”。上述结论可以解释这一现象。我们发现线上点评里正面评价的数量会高得不成比例。Amazon.com 上的产品评价里,五星(极度正面)的比一星(极度负面)和三、四星(基本正面)的多得多。在其它网站上对餐厅、电影和书籍的评价也有类似的趋势。


我们在实验中观察到的社交影响带来的偏见可以解释以上盲目性。假如他人的正面意见比负面意见更容易影响我们,盲目点评就可能源自我们更倾向于他人的正面意见这一本能:我们会群聚于正面意见之下,对于负面意见则保持怀疑态度。


在一项关于线上点评的倾向性的研究中,研究院胡南(音)、保罗·帕夫落和詹妮弗·张进行了另一项小实验。他们邀请一群学生到实验室里为一张 CD 打分。CD 是随机从亚马逊挑选的,事后研究员会将学生们给出的分数与这张 CD 在亚马逊网站上的评分进行对比。这个实验是为了了解随机挑选的小样本实际意见(大学实验室里的 66 名学生)与亚马逊上的评分的吻合程度。结果令人困惑:学生们的评分很正常,呈现出标准的钟型曲线:中间高,两头低。(说明两星、三星和四星评价居多,一星和五星的是少数。)而亚马逊上的评分则呈现为 J 型曲线(五星几乎是一星、两星、三星和四星总和的两倍)。


对此,作者们的解释是亚马逊的顾客更容易给出高分,因为他们已经主动购买了该产品,从而造成了选择偏差,导致正向评价。假若点评者都是购买了产品的人,并且他们也都更倾向于给出正面评价的话,选择偏差可以为 J 型曲线提供良好的解释。但有一个问题:没有在亚马逊上购物的顾客也可以点评。于是我就在想本次实验里点评者有没有事先看到已有的点评?研究报告没有提到这一点。我写信给作者询问,他们表示没有给点评者看对这张 CD 已有的评价,社会影响并非他们此次研究所涉及的范畴。换言之,他们模拟的那个环境和亚马逊上的评论环境很相似,但重要的区别在于点评者在评论前看不到已有评价的分布或是关于已有评价的任何信息。


在这一语境下,我重新考虑了自己给 Dojo 打出的四星评价。要是我没有看过其他点评者的好评,还会给四星吗?在看到那些评价之前我是打算给三星的。我在想:会不会每个人的点评都会受到社会压力的影响,从而更加倾向于正面?


造成线上点评呈 J 型曲线的因素可能有很多:选择偏差、作弊、或是社会压力偏差。这些过程都有可能造成盲目点评。但社会压力偏差最大的问题是会造成连锁反应:一则虚假的好评造成的影响是连续性的,它会极大地影响未来的评价。单是这一点已经十分惊人了。想想看:即使网站不断监测虚假评论并将它们删除,它们仍然会影响未来的真实点评。这一类的伤害是很难消除的。


可行的解决方案

如何超越这些人性,从而减少欺诈和偏差,这还需要进一步研究。在线上评价系统全面、深刻地影响着消费者决策的今天,科学家需要研究这些社会流程的原理,设计师也需要创造出能够消除偏差、减少人为操纵影响的系统。


通常,虚假点评背后的利益动机和网站设计(或规则)一起造成了欺诈或盲目好评现象。我们可以比较一下 TripAdvisor 与 Expedia 两个网站。在 TripAdvisor 上,人人都可以发表评论,但只有通过 Expedia 订了酒店的顾客才能在 Expedia 发表评论。迪娜·美兹淋、雅尼夫·多弗和朱迪斯·雪瓦利亚主导的一份精彩研究显示,那些有更大动力提交虚假评论的酒店(由单一公司拥有的独立品牌)在 TripAdvisor 上比 Expedia 上有更多的五星评论。相反,不太需要提交虚假评论的酒店(主要指不太倚赖线上评论的连锁品牌,它们作假要付出的名誉风险较高)就没有这种现象。

0

网站的设计与策略也会影响点评。2013 年,Reddit 改变了其页面设计,为管理员提供了“在评论发出后一段时间内不显示点赞次数”的选项。Reddit 表示这一功能是为了“最大限度地减少盲目跟风投票现象──无论是赞还是踩。”股票市场也有类似的措施。举例来说,纽约股票交易所施行了某种下限规则,当单日跌幅达到一定程度时就闭市。这也是为了减少负面羊群效应。


这一切意味着什么?

管理者不论是作为商业领袖还是作为消费者都应该谨慎对待线上点评。对于正面评价保持健康的怀疑态度可以纠正社会影响造成的偏差,但这种纠正对于负面点评则是不必要的。除此之外,管理者在点评过程的初期还应该尽可能地鼓励与促进真实的正面评论。若能制定系统性的规则来刺激满意的消费者尽早点评,则可以改变未来消费者的想法,让他们对自己所点评的产品与服务产生更多正面感受。


除此之外,管理者应该考虑上述关于羊群效应与盲目点评的研究所带来的对公司策略的提示。羊群心态是系统性的,如果从宏观角度观察它,或许可以让领导者在线上点评以外的各种情况下得到帮助。(固然线上点评本身也是很重要的领域。)举例来说,若产权价格背后的运作机制与点评类似,管理者就应该留意羊群心态对公司股价的影响。


我们对研究结果背后的行为机制进一步研究之后,发现朋友之间的羊群心态更加明显,他们更容易对互相的正面评价跟风,当朋友的想法得到了负面评价时,也更容易去背后力挺他们。这意味着社交网络的结构可以帮助引导点评的结构。随着 Facebook 和谷歌这样的网站鼓励更多的社交性点评──朋友的“点赞”和“+1”,以及更多被朋友分享出去的广告──社交影响造成的偏差会更有可能造成盲目点赞行为。


我们操纵点评的实验增加了投票总数,而由于大家普遍更认同网站上的正面评论,最终的分数被推得更高。但我们同时也发现操纵点评的行为实际上改变了人们的看法,而不仅仅是增加了正面评论的比例。为什么这么说?我们分析了点评总数(即人们愿意参与点评的几率)的变化和正面评论比例的变化,想搞清楚这项实验造成的点评变化背后的原因到底是因为有更多倾向于写正面评论的人在点评?还是因为很多倾向于写负面评论的人中途改变了观点?我们发现真实发生的是后面一种情况:负面评价中途转成了正面评价。人们的意见在改变。


现在再把这种变化和之前讨论过的羊群心态放在一起考虑。当我们把研究结果放到更大的“社会意见收集”的背景下考虑时,难免有一些额外的想法。原因很明显:我们恰好是在 2012 年美国总统大选期间进行的分析。听着收音机里的选举投票结果,我们在想:这些投票会预测甚至驱动选举结果吗?


近年来的许多经济危机──从房屋到基于按揭的证券──的核心都有羊群心态和盲目跟风的问题。理解它们背后的原理是消除其影响的第一步。理解了之后,自然会产生更多关于社会影响偏差与盲目投票的理论与实证性研究。这些研究不但对企业进行线上点评管理与营销以及点评网站的设计有帮助,也能影响公共政策,以保社会系统正常运作。政策制定者和网站设计师应该尽力从科学原理上理解羊群心态,设计出减少跟风行为的政策与网站,防止盲目点评。这样的政策有可能减少从选举到资本市场等各个领域的跟风行为。



原文发布时间为:2014-08-31

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
10月前
|
安全 前端开发 BI
医院安全(不良)事件管理系统源码:遵照PDCA全面质量循环管理方法而设计
医院安全(不良)事件管理系统通过规范事件上报、流转审批、数据统计、原因分析、措施制定、效果追踪的业务流程,全面覆盖医院所有科室,利用统计工具对本院不良事件数据进行深度分析,查找医疗安全管理的薄弱环节,帮助医疗机构高效处理医疗安全隐患,提高医疗安全(不良)事件的预警能力,采取针对性措施预防患者安全不良事件的发生。本系统亦可作为等级医院评审工作的辅助工具。
118 0
|
10月前
|
算法
PSMC软件分析群体历史有效群体大小步骤(bcftools+PSMC))
PSMC软件分析群体历史有效群体大小步骤(bcftools+PSMC))
|
11月前
|
数据采集 数据可视化 安全
ChatGPT根据销售数据、客户反馈、财务报告,自动生成报告,并根据不同利益方的需要和偏好进行调整?
该场景对应的关键词库(24个): 汇报对象身份(下属、跨部门平级、领导)、销售数据(销售额、销售量、销售渠道)、财务报告(营业收入、净利润、成本费用)、市场分析(市场份额、竞争情况、市场趋势)、客户反馈(客户满意度、客户投诉、客户留存率)、营销效果评估(广告投放效果、促销活动效果、营销策略效果)
274 0
|
监控 搜索推荐 数据挖掘
如何使用海关数据准确开发到客户
海关数据其实一直是外贸应用中最广泛的开发渠道,而且特别利好初学者,是企业开发新客户、监控同行、维护老客户以及决策参考的商战利器。当然,想通过海关数据精确找到客户,需要熟悉以下操作技巧。
147 0
|
存储 安全 数据管理
这个“2-3”的数据分类分级方法也许对你很有价值
当前,数据成为企业的生产要素参与分配,数据价值越发显得重要。
这个“2-3”的数据分类分级方法也许对你很有价值
|
机器学习/深度学习 数据采集 人工智能
『航班乘客满意度』场景数据分析建模与业务归因解释 ⛵
本文结合航空出行的场景,使用机器学习建模,详细分析了航班乘客满意度的影响因素:机上Wi-Fi服务、在线登机、机上娱乐质量、餐饮、座椅舒适度、机舱清洁度和腿部空间等。
375 0
『航班乘客满意度』场景数据分析建模与业务归因解释 ⛵
相亲软件开发,与用户留存息息相关的系统状态
相亲软件开发,与用户留存息息相关的系统状态
|
搜索推荐 数据可视化
舆情观察怎么做?
舆情观察作为一项系统性的工作,在舆情发展的不同阶段,其侧重点往往也不同。
|
安全
程序人生 - 从一个喷嚏的威力来了解,口罩的重要性与必要性
程序人生 - 从一个喷嚏的威力来了解,口罩的重要性与必要性
90 0
程序人生 - 从一个喷嚏的威力来了解,口罩的重要性与必要性
|
数据可视化 数据挖掘 大数据
以系统化视角反观产品运营,解读提升用户转化的“四部曲”
正常的活动运营通常会围绕公司经营目标,针对不同性质、不同类型的活动开展工作。这样的活动一般会分四个阶段:活动准备、活动策划、活动执行与活动复盘阶段。
以系统化视角反观产品运营,解读提升用户转化的“四部曲”