魔搭语音更新|七大模型最新开源,推理速度升级,几行代码可实现微调
自ModelScope魔搭社区发布以来,众开发者在ModelScope上传与下载模型,并集成到自己的语音识别服务中。为了方便用户更好地利用ModelScope进行语音识别服务,我们推出了语音识别基础框架FunASR,希望在语音识别的学术研究和工业应用之间架起一座桥梁。FunASR已经集成到ModelScope中,提供的工业级的语音识别模型的推理与微调定制,使得研究人员和开发者可以更加便捷的进行语音识别模型的研究和生产,促进语音识别生态的发展。
ICASSP2023|达摩院语音实验室入选论文全况速览
近日,语音技术领域国际会议ICASSP公布了本届论文审稿结果,阿里巴巴达摩院语音实验室有14篇论文被大会收录。本次被接收的论文研究方向涵盖语音识别、语音唤醒、语音增强、说话人日志、语义理解、多模态预训练等。
ICASSP (International Conference on Acoustics, Speech, and Signal Processing) 是国际声学,语音和信号处理会议,是IEEE信号处理协会组织的年度旗舰会议。历届的ICASSP会议都备受全球信号处理领域研究学者的广泛关注,ICASSP2023将于6月4号至6月10号于希腊举办。
行业前瞻 | 消费产业“双轮驱动”,跑出产销两端加速度
编者按:
当前,中国经济正处于从“大”向“强”转变的关键期,“消费互联网”在激发和满足消费需求上的成效有目共睹,同时“产业互联网”在提升供给能力和经营效益上的进展也逐步显现。只有打破藩篱,予以贯通,实现“消费互联网”和“产业互联网”双轮驱动,才有可能畅通经济循环,形成更高水平的供需动态平衡。实现“消费互联网”和“产业互联网”双轮驱动,将有可能为经济增长提供新动能。
全文约3790字,建议阅读时间10分钟。