AI语音正终结“耳聋工厂” 千万中国工人将受益

简介:

“这里吵不吵啊?”“啊?”

“我是问这里吵不吵?”“吵!我们都习惯了!

这是近日,浙江省金华某工业园探访中的一幕。

噪声,是很多工厂工人摆脱不掉的困扰,“职业性噪声聋”已成包括浙江省在内的全国第二大职业病。

近日,阿里巴巴机器智能技术实验室消息,其正研发在高工业噪声环境下的语音识别及传输技术,以后,众多车间工人将告别“通讯靠吼”的境况,简单的交流言语会转换成文字,让彼此心领神会。

3ac61d0f04597b7479a9b3d52fc7766eae3e94eb

阿里巴巴工程师正在调试AI语音识别系统

很多工厂车间 说话基本靠吼

厂房林立的浙江省金华某工业园内,12台编织机正轰鸣着织出白色编织袋布。

“分贝仪”显示,该车间噪声在“95分贝”上下。

根据《职业性噪声聋诊断标准》等相关标准,噪声大于等于85分贝便可认定为噪声作业环境,工人需有所防护。但在该车间,工人并未佩戴防护耳罩。

c13dbaba9d3076d28d07cb026a52105905f97e81

在97分贝环境中作业的编织厂工人

阿里巴巴AI语音工程师许先生介绍,很多中小型工厂车间的噪声都在90分贝以上。而工人很少佩戴防护器具。

在金华一家小型印刷厂,车间噪声接近90分贝。一位工人说,他每天工作10个小时左右,工厂接单多,他和同事须时刻交流、协同调适印刷机。“带上防护耳罩就听不见同事说话。

手机+语音终端 让防噪器具真正奏效

浙江省疾控中心4月25日公布职业病数据显示,近10年来,浙江省新发5924例职业病中,职业性噪声聋占29.21%。浙江省疾控中心环境与职业卫生所副所长张美辨表示,工人长期接触超85分贝噪声易患职业性噪声聋。

2018年1月,国家安全监管总局网站公布的2015、2016年全国职业病报告来看。职业性噪声聋已成“尘肺病”之后的第二大职业病。

c99746400f34a4638ec8297d10d7bd2e818f0847

在高噪声环境下,阿里巴巴工程师正在测试语音识别设备

要预防职业性噪声聋并不容易。

阿里巴巴AI语音工程师许先生表示,大多数中小制造企业没经验和能力考虑降噪。最现实的,还是给工人戴防护耳罩,但又不便于交流。

许工程师介绍,他们研究的语音交互技术,已实现在85分贝工业噪声下,将一米处正常音量语音转换为文字。

语音转换都在云端完成,只要有网络并配上类似智能音箱的语音终端,便可构建局域性的语音文字转换和传输系统。

“转换为文字的信息,可指定传输至手机等带显示屏设备。只要一部手机,一个语音终端,便可组建高噪声语音交互系统。” 许工程师说表示他和同事的语音测试仍在继续,“85分贝还是太安静,按照预期,要在95分贝噪音下识别语音。”


原文发布时间为:2018-05-2

本文作者:网商君

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
15天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
108 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
5天前
|
人工智能 Serverless 视频直播
活动实践 | AI智能体实时语音互动
AI智能体实时语音互动方案提供端到端的实时音频交互,用户通过终端SDK与云端AI智能体进行音频通话。AI智能体接收音频输入,依据预定义工作流处理并生成响应,通过ARTC网络推送结果。该方案支持灵活编排AI组件如语音转文字、大语言模型等,确保高可用、低延迟的通信体验。用户可轻松创建和管理智能体及实时工作流,实现高效对话,并可通过示例网站体验功能。
|
1月前
|
人工智能 机器人 Shell
AI语音机器人安装方法 AI机器人安装代码
AI语音机器人安装方法 AI机器人安装代码
33 2
|
1月前
|
人工智能 自然语言处理 机器人
手把手带你搭建一个语音对话机器人,5分钟定制个人AI小助手(新手入门篇)
本文介绍了如何从零开始搭建一个语音对话机器人,涵盖自动语音识别(ASR)、自然语言处理(NLP)和文本到语音合成(TTS)三大核心模块。通过使用开源工具如FunASR、LLaMA3-8B和ChatTTS,以及FastAPI和Gradio等技术,详细指导读者轻松实现个人AI小助手的构建,适合技术新手快速上手。
274 1
|
2月前
|
人工智能
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
75 1
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
|
2月前
|
存储 人工智能 开发者
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
129 0
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
|
2月前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
52 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
3月前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
3月前
|
人工智能 Linux iOS开发
AI超强语音转文本SenseVoice,本地化部署教程!
【9月更文挑战第7天】以下是AI超强语音转文本工具SenseVoice的本地化部署教程:首先确保服务器或计算机满足硬件和软件要求,包括处理器性能、内存及操作系统等。接着从官网下载适合的安装包,并按操作系统进行安装。配置音频输入设备和语言模型后,启动SenseVoice并测试其语音转文本功能。最后根据实际使用情况进行优化调整,并定期更新以获取最新功能。详细步骤需参照官方文档。
929 1
|
4月前
|
人工智能 数据处理 语音技术
通义语音AI技术问题之查看KAN-TTS在ModelScope上的模型列表如何解决
通义语音AI技术问题之查看KAN-TTS在ModelScope上的模型列表如何解决
61 10