达摩院

首页 标签 达摩院
# 达摩院 #
关注
1647内容
AI 直播合集 | 五位阿里技术大咖共话人工智能的现在与未来
近年来,AI持续大热并进入爆发期,本合集聚集阿里AI技术、产品专家,从整个AI领域发展趋势、相关技术,到AI的实际应用,分享AI技术发展趋势观点,展示阿里AI最新技术成果,干货满满,先一睹为快!
INTERSPEECH 2022论文解读|针对多方会议场景下说话人相关语音识别的对比研究
INTERSPEECH是由国际语音通讯协会 (International Speech Communication Association, ISCA) 创办的语音信号处理领域顶级旗舰国际会议。历届INTERSPEECH会议都备受全球各地语音语言领域人士的广泛关注。 ‍本文主要对比研究三种SA-ASR的方法,通过对说话人日志、语音分离和语音识别模块的耦合,在M2MeT竞赛上发布的真实会议场景语料库AliMeeting上进行了相关实验,有效地降低了说话人相关字错误率(SD-CER)。论文已被INTERSPEECH 2022接收。
如何使用魔搭ModelScope快速定制一款对长文本进行理解的模型?
‍本文详细介绍PoNet模型的原理以及其在ModelScope上的体验用法,包括PoNet简介原理、PoNet在ModelScope上怎么用、PoNet在各种下游任务上的效果等。
Python动物图像分割API简单调用实例演示,阿里达摩院视觉智能开放平台使用步骤
图像分割的目标是将图像中的像素分成不同的组或区域,使具有相似特征的像素属于同一组,从而实现目标对象的提取。常见的图像分割方法之一是语义分割(Semantic Segmentation)。 语义分割通过深度学习模型,如卷积神经网络(CNN),学习图像的特征表示,并生成像素级的分割结果。通常,语义分割使用全卷积网络(FCN)或其改进版本作为网络结构。编码器用于提取图像的特征表示,而解码器通过上采样操作将特征图还原到原始图像的尺寸,并生成分割结果。
达摩院2020十大科技趋势发布:科技浪潮新十年序幕开启
2020年第一个工作日,“达摩院2020十大科技趋势”发布。这是继2019年之后,阿里巴巴达摩院第二次预测年度科技趋势。
2022云栖内容精选—AI助力新型电力系统建设
本篇内容主要分为三个部分: 1. “双碳”目标下的新型电力系统与挑战 2. 在电力预测、调度决策、虚拟电厂决策方向的创新与积累 3. 关于未来的产品展望
免费试用