达摩院

首页 标签 达摩院
# 达摩院 #
关注
1643内容
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型,它具有高精度、高效率、便捷部署的优点,支持快速构建语音识别服务,最重要的是,FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能,也就是说,它不仅可以实现语音转写,还能在转写后进行标注,一石二鸟。
|
4月前
|
GitHub 1.3k 一款能“填色回忆”的神器:DDColor 让老照片鲜活又逼真
DDColor 是阿里达摩院推出的图像自动着色模型,采用双解码器架构与 Colorfulness Loss 技术,实现黑白图到高保真彩色图的智能转换。支持 GPU/CPU 推理,兼容历史照片、动画、游戏截图等多场景,具备高效、真实、多样、易用等特点,广泛适用于影像修复、艺术创作等领域。
三、培训课程-AIE技术分享之云计算与遥感分析的技术方案
为加强用户对AI Earth的理解,促进双方交流,提升AI Earth在地球科学领域的服务支撑能力,达摩院多位专家带来AI Earth地球科学云平台线上系列培训,干货满满,诚邀参与!
情感分析技术:让智能客服更懂人类情感
智能客服在解决客户高频业务问题的同时,也需要提供给客户多维度的、具有类人能力的助理、导购、语聊和娱乐等服务能力,提高客户对智能客服机器人的整体满意度。在此过程中,情感分析技术在机器人类人能力建设中起到了至关重要的作用。本文将围绕智能客服系统中人机结合的服务形式,从五个维度总结和介绍情感分析技术在智能客服系统中的应用场景,包括情感分析算法模型的原理及实际落地使用方式和效果分析。 本文作者:宋双永 王超 陈海青
Anolis OS 23 架构支持家族新成员:Anolis OS 23.3 版本及 RISC-V 预览版发布
Anolis OS 23.3在保障基础功能持续演进、完善安全漏洞的修复的同时,实现了对 RISC-V 的初步支持。
Qcon演讲实录 | XQUIC与多路径传输技术Multipath QUIC
大家好,我是阿里巴巴淘系技术部的刘彦梅(花名喵吉),今天给大家介绍的演讲内容是<XQUIC与多路径传输技术>, 下面是我在Qcon 2020上海站大会上的演讲内容,收录于专题<5G+人工智能>。这个演讲内容围绕XQUIC与多路径传输技术Multi-path QUIC,其中面向5G的多路径传输协议,算法和技术由淘系架构团队与达摩院XG实验室/阿里云AIS网络研究团队的研究人员共同研发(XG实验室/网络研究主要参与同学包括:马云飞,郑智隆,刘洪强),之前有一篇介绍XQUIC的相关内容<面向5G的阿里自研标准化协议库XQUIC>,大家有兴趣可以对照阅读。
免费试用