Instagram新推两款AI过滤工具,没错!背后功臣就是Deep Text

简介:

Instagram新推两款AI过滤工具,没错!背后功臣就是Deep Text

图片来源:TechCrunch

雷锋网6月30日消息  据外媒《连线》杂志报道,Instagram 本周四发布了两款新工具。一款为自动评论过滤器,另一款为垃圾消息过滤器。两款过滤工具的技术基础都采用了Facebook的人工智能系统。

该公司表示,这两项工具可用来减少垃圾消息的数量,同时屏蔽内容和视频中的攻击性评论。

自动评论过滤器自去年9月就一直存在,用户可以选择自动启动该程序。该程序可利用机器学习来识别可能引人反感的评论。如果在评论过滤器开启的情况下仍然出现攻击性评论,那么用户可以像以往一样直接向Instagram报告。Instagram表示,评论过滤器目前仅支持英语,不过未来将支持其他语言。

另一方面,垃圾消息过滤器自去年10月上线以来就一直处于对外界保密的状态。而上线9月有余都未被用户发现,于 Instagram 而言已经说不准是好事还是坏事。目前该功能可以自动清除英语、西班牙语、葡萄牙语、阿拉伯语、法语、德语、俄语、日语和汉语共9种语言的垃圾消息。

雷锋网(公众号:雷锋网)了解到,Facebook于2012年以10亿美元收购了Instagram,并将其内部技术迁移至Facebook的数据中心。

据报道,此次Instagram 发布的评论过滤器就是使用了Facebook 旗下AML实验室建立的“Deep Text”系统。在Facebook 上,其可以结合机器学习辅助器完成每日 40 亿次以上的翻译功能的处理。此外,该系统还能在一秒之内理解超过二十多种语言的数千封邮件的内容。

如此前雷锋网报道的 Facebook 在AI+广告中的应用和探索一文里,就详细的介绍了这一文本系统对 Feeds Ads的支持。

去年6月,Deep Text上线。其一开始被定位为内部工具,用来帮助Facebook 工程师快速排序大量文本,创建分类规则。其后 Instagram 高管深入了解该系统之后,立即看到了机会——借其打击垃圾邮件。因为对于Instagram 的用户来说,垃圾邮件几乎是一个极其影响用户体验的烦恼。

在决定使用该系统之后,Instagram 第一步就是聘请了一批人员对该平台进行评论,并将评论按照“垃圾邮件”和“非垃圾邮件”分类。事实上,这种工作,在社交媒体涉及的技术行业而言非常普遍。先利用人类来训练机器,让其执行单调甚至无聊的工作,如此反复,最终机器会慢慢变得聪明和智能。

Instagram 相关负责人表示,最终通过不断地数据整合,有3/4的数据被送入 Deep Text。基于此,Instagram 的工程师可创建算法,并对垃圾邮件可进行正确的分类。

在经历4个多月的不断测试和研究后,Instagram 团队在去年10月悄悄地上线了垃圾邮件过滤的功能。Instagram 的CEO Kevin Systrom对该功能的效果感到十分满意。他决定利用 Deep Text 来处理更复杂的问题——消除与Instagram 社区准则相悖的意见或评论。为此,Instagram 还公开发布了一个 1200字的长文,来解释其社区的精神。

与垃圾邮件过滤功能的开发过程类似,这次Instagram 又聘请了一大批的人员,每天就重复干一件事——看评论,并确定该评论是否合适。然后将其分类是否涉及欺骗 or 种族主义 or 性骚扰等等。所有这些工作人员都必须会两种语言。经过一段集中的处理,这些人一共分析了大约200万条评论。

同时,Instagram的员工率先在自己的手机上内测了该系统,以此协助公司调整算法。与垃圾邮件算法一样,该系统会基于文本语义来分析发帖的人和评论者(以及其发表的历史评论)之间的关系。通过一段时间对神经网络的训练和使用真实数据对模型的测试,Deep Text 已经可以探查到文本之间非常细微的语义差别。

直至今日,Instagram 终于正式宣布两大工具的上线。

当然,就目前这两大工具而言,仍然存在一些算法缺陷,如当被问及一些特定句子时,系统无法给出具体的回应。经过前文对 Instagram 这两个工具的开发过程的描述,我们也能看到 Instagram 的AI仍然依赖人类的力量,来训练机器学习系统。

正如 Facebook欧洲、中东和非洲地区公共政策副总裁 Richard Allen 如是表述,Facebook“还需要很长一段时间,才能依靠机器学习和人工智能来处理评估仇视言论时的复杂性。”

注:部分资料来源于Wired


本文作者:李秀琴

本文转自雷锋网禁止二次转载,原文链接


相关文章
|
12天前
|
机器学习/深度学习 人工智能 自然语言处理
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
Sketch2Lineart是一款基于人工智能的绘画工具,能够自动将手绘草图转换成清晰的线条画。该工具支持多种功能,如草图转线稿、自动描述生成、细节调整和风格定制等,适用于艺术创作、产品设计、教育培训等多个领域。
118 60
Sketch2Lineart:AI绘画工具,自动将手绘草图转换成清晰的线条画
|
2天前
|
编解码 人工智能 监控
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
VISION XL是一款基于潜在扩散模型的高效视频修复和超分辨率工具,能够修复视频缺失部分、去除模糊,并支持四倍超分辨率。该工具优化了处理效率,适合快速处理视频的应用场景。
30 6
VISION XL:支持四倍超分辨率的 AI 视频修复处理工具,提供去除模糊、修复缺失等功能
|
9天前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
42 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
Voice-Pro是一款开源的多功能音频处理工具,集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言,适用于教育、娱乐和商业等多个领域,为用户提供一站式的音频处理解决方案,极大地提高工作效率和音频处理的便捷性。
72 10
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
|
10天前
|
Web App开发 机器学习/深度学习 人工智能
Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图
Magic Copy 是一款开源的 AI 抠图工具,支持 Chrome 浏览器扩展。它基于 Meta 的 Segment Anything Model 技术,能够自动识别图像中的前景对象并提取出来,简化用户从图片中提取特定元素的过程,提高工作效率。
45 7
Magic Copy:开源的 AI 抠图工具,在浏览器中自动识别图像进行抠图
|
12天前
|
人工智能 自然语言处理 算法
Devika AI:开源的 AI 软件开发工具,理解和执行复杂的人类指令
Devika AI 是一款开源的 AI 软件开发工具,能够理解和执行复杂的人类指令。它通过分解任务、信息搜集和代码生成,帮助开发者提高效率,减少人工干预。本文将详细介绍 Devika AI 的功能、技术原理以及如何运行和配置该工具。
34 9
Devika AI:开源的 AI 软件开发工具,理解和执行复杂的人类指令
|
15天前
|
人工智能 Ubuntu 语音技术
ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言
ebook2audiobookXTTS 是一款开源的 AI 工具,能够将电子书转换为有声书,支持多种电子书格式和 16 种语言。该工具利用 Coqui XTTS 技术实现高质量的文本到语音转换,并提供命令行、Web 界面和 Docker 容器等多种使用方式。
37 3
ebook2audiobookXTTS:开源电子书转有声书 AI 工具,支持 16 种语言
|
15天前
|
人工智能 小程序 IDE
【一步步开发AI运动小程序】九、姿态辅助调试桌面工具的使用
随着AI技术的发展,各大厂商推出的AI运动APP如“乐动力”、“天天跳绳”等,使云上运动会、线上健身等概念大热。本文将指导你如何利用“云智AI运动识别小程序插件”,在微信小程序中实现类似功能,包括工具搭建、服务启动及数据回传等步骤,助力开发者高效开发AI运动小程序。
【一步步开发AI运动小程序】九、姿态辅助调试桌面工具的使用
|
23天前
|
机器学习/深度学习 人工智能 自然语言处理
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
Documind 是一款利用 AI 技术从 PDF 中提取结构化数据的先进文档处理工具,支持灵活的本地或云端部署。
82 8
Documind:开源 AI 文档处理工具,将 PDF 转换为图像提取结构化数据
|
20天前
|
人工智能 数据可视化 API
AI Agents Loop异步执行可视化Tutorial 借助AgentBoard工具可视化工作流
本文介绍了AI Agent的异步执行循环(Agent Loop),并展示了如何利用开源框架agentboard可视化这一过程。通过分析不同框架(如AutoGen、LangGraph、AutoAgent)对Agent Loop的抽象,文章详细说明了从简单的功能调用到复杂的多阶段执行流程的设计。此外,还提供了使用agentboard进行日志记录与流程可视化的具体示例,包括安装步骤、代码实现及运行方法,帮助开发者更高效地调试和优化AI Agent的应用。
AI Agents Loop异步执行可视化Tutorial 借助AgentBoard工具可视化工作流