网易易盾:以人工智能技术提升UGC产品内容安全

本文涉及的产品
内容审核增强版开发者实践包,10万次资源包1年有效
简介:

【51CTO.com原创稿件】互联网发展至今,已经成为人们的必需品。我们无论是在工作还是生活中,都会使用互联网。在Web 2.0时代,用户原创内容UGC大量出现,然而,一些垃圾信息、广告、色情图片等内容,正破坏着互联网的纯净度。

过去,多数企业会采用人工进行内容审核,然而误报率较高,成本也很高,随着音频、视频等流媒体的出现,内容审核的难度也越来越大。适应这种需求,网易今年推出了内容反垃圾产品网易易盾,为当下解决互联网内容垃圾方面提供了新思路和新方法。

内容反垃圾的重要性:规避风险,提升体验

有数据显示,仅2016年上半年,我国网民平均每周收到垃圾邮件高达18.9封、垃圾短信数量约为20.6条、骚扰电话更是多达21.3个,紧跟其后的还有恶意电脑广告弹窗和APP推送。而这些只是在网民体验层面的影响,对互联网服务尤其是UGC类产品来说,网络垃圾的泛滥无疑加重了运营风险。

网易易盾总经理周森

网易易盾的总经理周森认为,网络垃圾带来的风险主要集中在两个方面,一是监管,政策法规的安全,如果UGC产生的内容违反了政策法规,企业就会面临关闭的风险;二是用户体验,如果UGC不审核,会出现很多广告、灌水、刷屏等现象,对于用户体验来说会造成极大的影响。

既然网络垃圾带来如此大的风险,什么样的企业需要进行内容反垃圾呢?周森表示,只要网站上有UGC,就需要审核,进行内容反垃圾。过去,由于政府的监管压力,大多数企业都是自己来做内容反垃圾,通过技术+人工审核的方式实现,成本也相对比较高。

但是,内容反垃圾不是三两个人就可以完成的。周森告诉笔者,内容反垃圾一般是通过技术手段以及运营的流程制度来保证的,需要一定规模的团队才能运转。通常情况下,审核团队最少需要7个人员,7*24小时运转才能保证内容审核工作完成。而如今,网络垃圾的形式也多种多样,除了基本的文本、图片,还有视频、音频等多媒体形式,内容审核的难度也会加大,因此,企业不得不重视内容反垃圾。

网易易盾的核心竞争力:人工智能+亿级特征库

过去,我们所理解的网易主要是门户网站、游戏、邮箱服务,以及网易云音乐、网易考拉等口碑产品,那么,为什么网易要做内容反垃圾的云服务呢?周森告诉笔者,基于网易十九年对互联网产品研发体系及运营模式的丰富经验和深入探索,网易自去年起,已经面向市场推出一系列场景化云服务,致力于更好更快地满足B端客户业务需求、帮助其解决业务痛点及实现业务目标。而网易易盾是其中的智能反垃圾云服务,是网易云计算的一部分,提供广告过滤、智能鉴黄、暴恐识别及谣言排查等反垃圾服务。

网易易盾的核心思想就是用人工智能的技术,来进行反垃圾过滤,减少企业的人工审核,降低人工运营成本,以此来规避企业的运营风险,提升产品的用户体验。

周森介绍了网易易盾的产品实力:首先是特征库,基于网易19年的技术沉淀,积累了亿级别的特征库,按照文本和图片分类形成不同类别的特征库,同时还针对每个行业设定专门的特征库。第二就是技术实力,网易拥有众多专业的技术人员,也在多年实践中积累下丰富的技术经验。

网易易盾的产品共分为四类反垃圾服务,首先是广告过滤,基于网易邮件反垃圾的智能过滤技术,以及亿级广告特征库,进行精准过滤;第二是智能鉴黄,基于智能识别及海量样本库、信用库,高效识别色情图片;第三是暴恐识别,结合暴恐敏感图像智能分析技术,快速识别定位暴恐目标图像;第四是谣言排查,基于样本库及专业运营经验,快速排查谣言等有害信息。

云服务模式:SaaS级产品,便捷调用

过去,互联网内容以文字为主,所以大家最常用的就是关键词匹配的方式进行内容识别。但是,关键词的方式极易产生误判,对于用户的体验也不好,所以,网易易盾进行了技术改进。在文字方面,通过关键词识别、规则引擎、自然语言处理三阶段的技术,来保证识别的准确度。周森表示,目前,自然语言处理技术相对使用比较多,毕竟汉语言博大精深,双关、同音字、多音字等都相对比较复杂,采用自然语言技术可以提高准确度。

网易易盾通过人工智能技术过滤掉垃圾信息,文本相对过滤速度比较快,图片与视频相对较慢,如果出现争议的判断,则由人工介入进行再次审核。那么,机器过滤的速度有多快呢?周森告诉笔者,依托于网易云计算资源,网易易盾可以支持单日亿级别数据的运算能力,快速响应,实时返回。目前,网易易盾的准确率已经达到了99.8%以上。

网易易盾是SaaS级产品,而且使用的门槛也相对较低。主要是调用网易易盾的几个接口,将内容传送给网易易盾就可以实时返回内容的等级,例如垃圾、疑似、正常等。企业的运营人员就很容易的来判别哪些内容是有问题的,并且进行处理。

周森透露,未来,网易易盾将会继续深耕在网络安全方面,会在近几个月推出验证码,保护产品的登录注册过程。


本文作者:鸢玮

来源:51CTO

相关文章
|
3天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
29 3
|
2天前
|
人工智能 文字识别 运维
AI多模态的5大核心关键技术,让高端制造实现智能化管理
结合大模型应用场景,通过AI技术解析高端制造业的复杂设备与文档数据,自动化地将大型零件、机械图纸、操作手册等文档结构化。核心技术包括版面识别、表格抽取、要素抽取和文档抽取,实现信息的系统化管理和高效查询,大幅提升设备维护和生产管理的效率。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与深度学习:探索未来技术的无限可能
在21世纪,人工智能(AI)和深度学习已经成为推动科技进步的重要力量。本文将深入探讨这两种技术的基本概念、发展历程以及它们如何共同塑造未来的科技景观。我们将分析人工智能的最新趋势,包括自然语言处理、计算机视觉和强化学习,并讨论这些技术在现实世界中的应用。此外,我们还将探讨深度学习的工作原理,包括神经网络、卷积神经网络(CNN)和循环神经网络(RNN),并分析这些模型如何帮助解决复杂的问题。通过本文,读者将对人工智能和深度学习有更深入的了解,并能够预见这些技术将如何继续影响我们的世界。
26 7
|
4天前
|
人工智能 自然语言处理 自动驾驶
技术与人性:探索人工智能伦理的边界####
本文深入探讨了人工智能技术飞速发展背景下,伴随而来的伦理挑战与社会责任。不同于传统摘要直接概述内容,本文摘要旨在引发读者对AI伦理问题的关注,通过提出而非解答的方式,激发对文章主题的兴趣。在智能机器逐渐融入人类生活的每一个角落时,我们如何确保技术的善意使用,保护个人隐私,避免偏见与歧视,成为亟待解决的关键议题。 ####
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
57 11
|
7天前
|
人工智能 自然语言处理 算法
企业内训|AI/大模型/智能体的测评/评估技术-某电信运营商互联网研发中心
本课程是TsingtaoAI专为某电信运营商的互联网研发中心的AI算法工程师设计,已于近日在广州对客户团队完成交付。课程聚焦AI算法工程师在AI、大模型和智能体的测评/评估技术中的关键能力建设,深入探讨如何基于当前先进的AI、大模型与智能体技术,构建符合实际场景需求的科学测评体系。课程内容涵盖大模型及智能体的基础理论、测评集构建、评分标准、自动化与人工测评方法,以及特定垂直场景下的测评实战等方面。
34 4
|
6天前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
11天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗健康领域的应用与挑战####
本文旨在探讨人工智能(AI)技术在医疗健康领域的创新应用及其面临的主要挑战。通过深入分析AI如何助力疾病诊断、治疗方案优化、患者管理及药物研发,本文揭示了AI技术在提升医疗服务质量、效率和可及性方面的巨大潜力。同时,文章也指出了数据隐私、伦理道德、技术局限性等关键问题,并提出了相应的解决策略和未来发展方向。本文为医疗从业者、研究者及政策制定者提供了对AI医疗技术的全面理解,促进了跨学科合作与创新。 ####
|
9天前
|
人工智能 算法
AI技术在医疗领域的应用及其挑战
【10月更文挑战第31天】本文将探讨AI技术在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念开始,然后详细介绍其在医疗领域的应用,包括疾病诊断、药物研发、患者护理等方面。最后,我们将讨论AI技术在医疗领域面临的挑战,如数据隐私、算法偏见等问题。
|
9天前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。