python的webrtc库实现语音端点检测
python的webrtc库实现语音端点检测
文章源码在 https://github.com/wangshub/python-vad
引言
语音端点检测最早应用于电话传输和检测系统当中,用于通信信道的时间分配,提高传输线路的利用效率.
DFSMN在阿里巴巴的应用以及如何采用开源代码训练DFSMN模型
DFSMN模型是语音识别中一种先进的声学模型,语音识别中的声学模型是语音识别技术中的核心所在。具体来说,声学模型是根据输入语音进行发音可能性的识别,结合语言模型、解码器,就构成了完整的语音识别系统。本次开源的DFSMN模型,是阿里巴巴的高效工业级实现,相对于传统的LSTM、BLSTM等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。
聚焦云通信创新升级?这场阿里云通信在线沙龙有干货
云通信作为通信基础设施,具有很强的行业普适性和刚需性,其业务场景涵盖了用户整个生命周期。然而,在企业使用云通信的过程中,依旧会面临到技术门槛高、系统维护治理难、业务场景适配挑战大等问题,阿里云通信是如何围绕用户需求,打造场景化产品服务体系,面向用户构建安全、易用、稳定、智能的技术系统,用AI能力赋能企业降本提效?在5月13日的阿里云通信“加油行动”在线沙龙中,阿里云通信资深运营专家孔繁盛、高级产品经理李海波和高级技术专家刘强奇为我们带来了答案。