直播内容自动化审核实践

简介: 当今短视频、视频直播正如火如荼进行时,沉淀多年的语音直播也正迎来最大的风口。虽然语音直播未来发展的潜力巨大,但现实中也面临着诸多挑战。语音直播审核、个性化语音内容则是挑战中最紧迫的两项。 接下来我们逐一分析并给出我们的解决方案。

一、背景介绍
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音技术主要分为语音识别技术以及语音合成技术。语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文字或命令从而执行某些动作,比如车联网、智能语音助手、智能家居等。语音合成则是利用计算机将文字信息转变为人可以听得懂并且是流利的汉语口语。比如新闻播报、有声阅读等。

二、语音直播实践

当今短视频、视频直播正如火如荼进行着,沉淀多年的语音直播也正迎来最大的风口。区别于传统的视频直播,语音直播所具备的天然优势是故事性更强、互动性更高、场景覆盖更广、内容具备沉淀价值,并且对于语音主播不需要露脸、不需要颜值、门槛降低,因此语音直播从整体来讲有着更持久的生命力。
虽然语音直播未来发展的潜力巨大,但现实中也面临着诸多挑战。 语音直播审核、个性化语音直播内容便是其中的典型。限于篇幅,我们本次只分享语音直播审核这一个话题。个性化语音直播内容后续再另起篇目讨论。
1)语音直播审核
语音直播的使用门槛虽然降低了,但是同样面临着可能出现的不当言论风险。因此内容审核是必不可少的一个流程。传统语音审核通常由审核员人工参与,虽然审核效果可控,但内容审核带来的工作量也是巨大的。一个审核员在极限条件下可以同时审核5~8场语音直播,但是在晚高峰期间同时在线的语音直播多达数千场甚至与万场,那么人工审核便是不可能完成的任务,所以传统的做法就是要么就限制开播场次,要么就干脆放弃审核,但这背后所面临的损失也是可想而知的。
针对上诉问题,我们提出了自动化机器审核外加人工干预的解决方案,简称为智能审核小助手。 该方案的大致流程为机器自动化实时完成在线语音直播的内容审核,在机器审核过程中会实时检索语音内容,该内容一旦命中敏感词、敏感字则会触发报警,该报警会根据提前设定的规则来自动完成一系列操作。比如通知审核员人工干预或者直接关闭该场直播。

image.jpeg

语音直播自动化审核场景最基本的要求是语音的实时翻译以及翻译结果的准确性,这是自动化语音审核服务的最低要求,同时也是最大的挑战。在充分调研与测试评估后,我们选择集成阿里云智能语音交互方案。 该方案提供的语音识别服务满足我们的产品预期,同时也非常适合我们的使用场景以及对该业务的未来规划。实际上,自动化语音审核服务上线后确实解决了我们所遇到的问题。有80%的语音直播的内容审核是通过自动化方式来解决的。以下是系统集成架构:

image.jpeg

语音直播过程中,语音翻译的实时性是非常严格的,不能出现延迟翻译或者是遗漏翻译,比如主播讲的话30秒后才翻译完成甚至于干脆漏掉了,这就严重不符合产品预期了。 我们使用阿里云智能语音交互服务还是比较早的,当时语音翻译类型还没有对外提供长语音实时翻译,只有一句话语音识别。为了满足自动化语音审核的实时行与连续性,我们的解决方案是对直播流进行切分,也就是说把主播讲的话做N段切分,以最小单位进行一句话实时翻译。 这么做的好处是保证了实时性,并且也不会遗漏翻译,但也存在缺点,那就是数据会出现冗余。但缺点即便可见,依然也符合我们早期的功能定位。 直播流如何进行切片呢?
这就需要关注到直播流原理以及直播协议了。 简单来说,直播流是由若干个M3U8小文件组成,m3u8文件中提供了音视频片段的下载地址。我们通过该地址url 可以下载到一段直播片段。该片段是视频格式的,因此需要对视频进行分离,将语音部分抽取出来并进行转码,最后post方式调用阿里云语音识别api。

image.jpeg


在成功调用阿里云语音识别restful api后,语音翻译的结果会通过json格式返回。其中result字段存储翻译内容。 我们会将翻译内容实时展示在审核系统的页面中,从而实现机器审核、机器监控、人工干预等动作。相关效果如下图:


image.jpeg

此外,我们还会将语音直播翻译内容存入到阿里云数据仓库odps中,也就是现在的阿里云MaxCompute。语音翻译内容对于用户画像建设、推荐算法模型训练等环节有着及其重要的数据价值。

image.jpeg

三、未来展望
目前我们的解决方案是一句话语音翻译,虽然缓解了人工审核的工作量,但也存在着一些缺点。比如语音翻译数据冗余,语音翻译实效性不是准实时等。对此我们正在尝试将一句话识别换成实时语音识别。实时语音识别类似与同声传译,该效果会有效改善审核体验。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
1月前
|
人工智能 JavaScript 前端开发
自动化测试框架的演进与实践###
本文深入探讨了自动化测试框架从诞生至今的发展历程,重点分析了当前主流框架的优势与局限性,并结合实际案例,阐述了如何根据项目需求选择合适的自动化测试策略。文章还展望了未来自动化测试领域的技术趋势,为读者提供了宝贵的实践经验和前瞻性思考。 ###
|
2月前
|
机器学习/深度学习 人工智能 jenkins
软件测试中的自动化与持续集成实践
在快速迭代的软件开发过程中,自动化测试和持续集成(CI)是确保代码质量和加速产品上市的关键。本文探讨了自动化测试的重要性、常见的自动化测试工具以及如何将自动化测试整合到持续集成流程中,以提高软件测试的效率和可靠性。通过案例分析,展示了自动化测试和持续集成在实际项目中的应用效果,并提供了实施建议。
|
2月前
|
Java 测试技术 持续交付
探索自动化测试在软件开发中的关键作用与实践
在现代软件开发流程中,自动化测试已成为提升产品质量、加速交付速度的不可或缺的一环。本文深入探讨了自动化测试的重要性,分析了其在不同阶段的应用价值,并结合实际案例阐述了如何有效实施自动化测试策略,以期为读者提供一套可操作的实践指南。
|
2月前
|
监控 jenkins 测试技术
自动化测试框架的构建与实践
【10月更文挑战第40天】在软件开发周期中,测试环节扮演着至关重要的角色。本文将引导你了解如何构建一个高效的自动化测试框架,并深入探讨其设计原则、实现方法及维护策略。通过实际代码示例和清晰的步骤说明,我们将一起探索如何确保软件质量,同时提升开发效率。
53 1
|
29天前
|
运维 监控 持续交付
自动化运维在现代数据中心的应用与实践####
本文探讨了自动化运维技术在现代数据中心中的应用现状与实践案例,分析了其如何提升运维效率、降低成本并增强系统稳定性。通过具体实例,展示了自动化工具如Ansible、Puppet及Docker在环境配置、软件部署、故障恢复等方面的实际应用效果,为读者提供了一套可参考的实施框架。 ####
|
29天前
|
运维 监控 Devops
自动化运维实践:打造高效的DevOps流水线
在软件开发的快节奏中,自动化运维成为提升效率、确保质量的关键。本文将引导你理解自动化运维的价值,通过实际案例分享如何构建一个高效、可靠的DevOps流水线。我们将从持续集成(CI)开始,逐步深入到持续部署(CD),并展示代码示例来具体说明。准备好让你的运维工作飞跃式进步了吗?让我们开始吧!
|
1月前
|
jenkins 测试技术 持续交付
自动化测试框架的搭建与实践
在软件开发领域,自动化测试是提升开发效率、确保软件质量的关键手段。本文将引导读者理解自动化测试的重要性,并介绍如何搭建一个基本的自动化测试框架。通过具体示例和步骤,我们将探索如何有效实施自动化测试策略,以实现软件开发流程的优化。
70 7
|
2月前
|
敏捷开发 Java 测试技术
软件测试中的自动化策略与实践
在快速迭代的软件开发周期中,自动化测试是确保产品质量和提升开发效率的关键。本文将深入探讨自动化测试的重要性,介绍实用的自动化测试框架,并通过一个具体的代码示例,说明如何实现一个简单的自动化测试脚本。
48 12
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
智能化软件测试:AI驱动的自动化测试策略与实践####
本文深入探讨了人工智能(AI)在软件测试领域的创新应用,通过分析AI技术如何优化测试流程、提升测试效率及质量,阐述了智能化软件测试的核心价值。文章首先概述了传统软件测试面临的挑战,随后详细介绍了AI驱动的自动化测试工具与框架,包括自然语言处理(NLP)、机器学习(ML)算法在缺陷预测、测试用例生成及自动化回归测试中的应用实例。最后,文章展望了智能化软件测试的未来发展趋势,强调了持续学习与适应能力对于保持测试策略有效性的重要性。 ####
|
2月前
|
敏捷开发 Devops 测试技术
探索自动化测试之美:从理论到实践
在软件开发的海洋中,自动化测试犹如一座灯塔,指引着项目向着质量和效率的彼岸。本文将扬帆起航,从自动化测试的意义出发,穿越工具选择的海域,停靠在实战演练的岛屿,最终抵达持续集成的港湾。我们将通过一个具体的代码示例,体验自动化测试的魅力,并分享如何将这些实践应用到日常的软件质量保证过程中。