RTC引用场景,深度学习有哪些有效较为通用的方法,可以结合传统技术,弥补传统技术缺陷?
tc场景对数据的处理是实时的,而且需要在手机端处理,由于目前手机算力限制,不能做很复杂的模型。目前在rtc场景中,通用的模型以CNN和RNN为主。而且由于rtc场景下数据是以数据流形式进行推理,CNN不能使用普通的conv和transpose conv,需要使用casual conv和casual transpose conv,并且实现类似于RNN的流式推理方式。主流的开源离线推理框架都没有这种方式,还需要自己实现一套rtc场景的离线推理框架。比如传统NLP算法很难对残余回声精确建模,靠适配和调参费时费力,且很难达到很好的效果。而深度学习模型的强大的非线性学习能力正好可以弥补传统算法的缺点,但深度学习模型的稳定性不如传统算法,在面对与训练集差异较大的数据时,效果会大打折扣,所以在传统自适应滤波的基础上结合深度学习的NLP模型,弥补双方不足,可以较好的解决传统回声消除的非线性回声问题。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。