Reddit 事实核查新方法,人为劝导和智能算法结合

简介:

为了控制假新闻传播,新闻机构和平台究竟应该依赖算法排除,还是靠受众自己分辨?最近,一项试验结果表明,这两者办法是可以被结合起来的。

image

人工智能微调:将人为劝导和智能算法相结合

Reddit 论坛的 “/r/worldnews” 板块和麻省理工大学的研究者通过合作调研发现,鼓励用户对潜在的假新闻和耸人听闻的报道进行事实核查,不但能让用户评论数量翻倍,同时还能让这些假新闻的 “得分(Reddit score)” 降低(即将权重被刷到页面底部),调查报告表示:“这项数据能显著影响文章在子板块(subreddit)里的排名。”

image

调研组组长、博士生内森-马提亚斯表示,这项研究证明了所谓 “人工智能微调(AI nudge)” 的能力,这种技术把人为劝导和智能算法结合起来实现理想的结果,同时也不增加任何影响用户习惯的规则。这个想法的灵感来源于理查德-泰勒和凯斯-桑斯坦的研究,他们相信,“微调”可适用于政府和其他机构。

image

马提亚斯说:“研究结果显示,我们关注的很多问题,比如假新闻泛滥,是由一系列人为和算法因素的综合作用造成的。通过劝导受众改变行为模式,我们甚至都不需要去控制算法系统。”

用户“怀疑+反对”新闻信息源

他们的试验是这样进行的:子板块的版主提供了一系列 “总被举报” 的 ”标题党、不实信息” 新闻消息源,名单们大部分是英国和澳大利亚的八卦小报(有趣的是,《纽约邮报》也在名单之中)。

这些在两个月的时间里被提交到子板块的网站链接要么无监管;要么有用户评论表示怀疑、需要事实核查,如果无法独立证实,还会给文章点 “反对(downvote)”。

报告中表示:置顶评论带有怀疑倾向,往往会让评论区内包含至少一个链接的概率提升 1.28%;置顶评论中带有怀疑倾向同时还点反对的概率提升则为 1.47%。这两项的影响都是很显著的。

image

讨论 “r/worldnews” 板块里的小报内容如果鼓励事实核查链接,能把评论带链接的平均概率提升到 201%;如果鼓励怀疑真实性并点反对,可以把平均概率提升到 203%。

总体来说,小报文章若有鼓励事实核查的置顶评论,其得分占到了没有置顶评论文章的 49.1%,效果显著。但置顶评论中包含鼓励反对的内容,却没有发现明显的数据改变。鼓励怀疑能让小报文章的得分增长放缓,鼓励怀疑和反对则能稍微主张这些文章流量的增长。

事实核查给向用户放权

马提亚斯和合作伙伴梅瑞-莫的研究项目名叫 “CivilServant”,就是为了帮助和引导网络社区进行各种试验,议题包括管理、骚扰等等。马提亚斯选择 Reddit 的原因,也是因为这家论坛 “给了用户很大权力”,不管是自上而下的社区管理,还是自我监管。

因此,Reddit 是个理想的研究对象,论坛内容有其重要性,每天都影响着数百万人如何获取新闻信息。在其新用户的板块中,注册人数就超过 1500 万,每天文章发布量达到 450 篇,算得上是英文互联网上规模最大的世界新闻讨论单组了。所以如果能处理好不靠谱的新闻源,绝对能控制假新闻的传播。

反作用:或反助长假消息传播

试验结果是乐观的,但研究者依然有他们的担忧。比如在事实核查的过程中,“/r/worldnews” 的用户不自觉就助长了这些信息的传播。因为 Reddit 网站的算法是受文章评论活跃度影响的,无法分辨这些评论的意图是什么。所以,事实核查评论突增,反而会让该文章更流行。

image

这就是所谓的反作用了。早在 2010 年布伦丹-尼汉和杰森-雷弗勒发表的论文中就提到了这个概念,在某些情况下,修正虚假信息的举措反而会助长虚假信息的传播。去年还有一篇论文,则表示虽然这种反作用出现的频率并不高,但依然值得担忧。比如唐纳德-特朗普关于选举骗局的言论虽然引来了媒体疯狂的事实核查,但却导致更多人相信他的话。马提亚斯说:“这就是算法引发的结果。”

另外,建议用户点反对,效果并不明显。马蒂亚斯发现这些文章被点反对后,事实核查所造成的效果反而会被抹去,但因为缺乏相关数据,还很难寻找出原因。一个可能的理由,就是心理学上讲的 “逆反”——或许有用户不喜欢版主这样鼓励他人点反对的做法,反而去点赞了。

这项试验的很多结果都只适用于 Reddit 一家网站,马提亚斯也表示,有些结果也值得其他网站和新闻机构借鉴。

“我希望这项试验能够激发新闻机构去思索受众的力量,跟他们合作,以应对像假新闻这样的挑战。”他说,“Reddit 的版主们完全可以选择找团队人工审查的办法,但我们还是找到了新办法,邀请规模更广的受众群体来一起处理这个问题。”

文章转载自 开源中国社区 [http://www.oschina.net]

目录
相关文章
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
116 4
|
3月前
|
存储 算法 Java
解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用
在Java中,Set接口以其独特的“无重复”特性脱颖而出。本文通过解析HashSet的工作原理,揭示Set如何利用哈希算法和equals()方法确保元素唯一性,并通过示例代码展示了其“无重复”特性的具体应用。
61 3
|
2月前
|
存储 算法 安全
SnowflakeIdGenerator-雪花算法id生成方法
SnowflakeIdGenerator-雪花算法id生成方法
25 1
|
2月前
|
JSON 算法 数据挖掘
基于图论算法有向图PageRank与无向图Louvain算法构建指令的方式方法 用于支撑qwen agent中的统计相关组件
利用图序列进行数据解读,主要包括节点序列分析、边序列分析以及结合节点和边序列的综合分析。节点序列分析涉及节点度分析(如入度、出度、度中心性)、节点属性分析(如品牌、价格等属性的分布与聚类)、节点标签分析(如不同标签的分布及标签间的关联)。边序列分析则关注边的权重分析(如关联强度)、边的类型分析(如管理、协作等关系)及路径分析(如最短路径计算)。结合节点和边序列的分析,如子图挖掘和图的动态分析,可以帮助深入理解图的结构和功能。例如,通过子图挖掘可以发现具有特定结构的子图,而图的动态分析则能揭示图随时间的变化趋势。这些分析方法结合使用,能够从多个角度全面解读图谱数据,为决策提供有力支持。
107 0
|
3月前
|
存储
基于遗传算法的智能天线最佳阵列因子计算matlab仿真
本课题探讨基于遗传算法优化智能天线阵列因子,以提升无线通信系统性能,包括信号质量、干扰抑制及定位精度。通过MATLAB2022a实现的核心程序,展示了遗传算法在寻找最优阵列因子上的应用,显著改善了天线接收功率。
|
3月前
|
算法 索引
HashMap扩容时的rehash方法中(e.hash & oldCap) == 0算法推导
HashMap在扩容时,会创建一个新数组,并将旧数组中的数据迁移过去。通过(e.hash & oldCap)是否等于0,数据被巧妙地分为两类:一类保持原有索引位置,另一类索引位置增加旧数组长度。此过程确保了数据均匀分布,提高了查询效率。
51 2
|
3月前
|
搜索推荐 Shell
解析排序算法:十大排序方法的工作原理与性能比较
解析排序算法:十大排序方法的工作原理与性能比较
89 9
|
3月前
|
存储 算法 Java
数据结构与算法学习八:前缀(波兰)表达式、中缀表达式、后缀(逆波兰)表达式的学习,中缀转后缀的两个方法,逆波兰计算器的实现
前缀(波兰)表达式、中缀表达式和后缀(逆波兰)表达式的基本概念、计算机求值方法,以及如何将中缀表达式转换为后缀表达式,并提供了相应的Java代码实现和测试结果。
153 0
数据结构与算法学习八:前缀(波兰)表达式、中缀表达式、后缀(逆波兰)表达式的学习,中缀转后缀的两个方法,逆波兰计算器的实现
|
3月前
|
机器学习/深度学习 人工智能 开发框架
【AI系统】AI 学习方法与算法现状
在人工智能的历史长河中,我们见证了从规则驱动系统到现代机器学习模型的转变。AI的学习方法基于深度神经网络,通过前向传播、反向传播和梯度更新不断优化权重,实现从训练到推理的过程。当前,AI算法如CNN、RNN、GNN和GAN等在各自领域取得突破,推动技术进步的同时也带来了更大的挑战,要求算法工程师与系统设计师紧密合作,共同拓展AI技术的边界。
140 1
|
5月前
|
JavaScript 算法 前端开发
JS算法必备之String常用操作方法
这篇文章详细介绍了JavaScript中字符串的基本操作,包括创建字符串、访问特定字符、字符串的拼接、位置查找、大小写转换、模式匹配、以及字符串的迭代和格式化等方法。
JS算法必备之String常用操作方法

热门文章

最新文章