达摩院的搜索结果_热门_第11页-阿里云开发者社区

xxrjl

|

博文

小蜜团队万字长文 | 讲透对话管理模型最新研究进展

从人工智能研究的初期开始，人们就致力于开发高度智能化的人机对话系统。对话管理模型研究最新进展源于前沿的深度的研究……

# 客服工作台 # 自然语言处理 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 达摩院 # 算法 # 数据挖掘 # 机器人 # API # 数据处理 # 人机交互

小攻云攻略

|

博文

新突破！存算一体芯片，来了

分享一个好消息——达摩院成功研发存算一体芯片！

# 存储 # 机器学习/深度学习 # 人工智能 # 达摩院 # 搜索推荐 # 算法 # vr&ar # 数据中心 # 芯片 # 内存技术

技术小达人

|

博文

如何用一套语音识别系统实现多语种混合自由说？

语音识别技术，也被称为自动语音识别 (Automatic Speech Recognition，ASR)，其目标是将语音转成文字。

# 智能语音交互 # 智能语音交互 # 达摩院 # 大数据 # 语音技术 # iOS开发

阿里云大数据Al技术

|

博文

|

来自：大数据与机器学习

阿里云机器学习 PAI 年度发布：持续锻造云原生的 AI 工程平台

刚刚结束的 2022 云栖大会上，阿里云机器学习平台 PAI 发布了在开发者服务、企业级能力、工程性能优化三个方向的一系列新特性和功能。从支撑达摩院上云，到服务金融、汽车、互联网、制造等多个行业的创新实践，机器学习 PAI 不断夯实云原生的 AI 工程平台能力。

# 人工智能平台 PAI # 云原生大数据计算服务 MaxCompute # 机器学习/深度学习 # 人工智能 # 分布式计算 # 达摩院 # Cloud Native # 数据可视化 # 自动驾驶 # 大数据 # MaxCompute # 开发者

开发者小助手_LS

|

博文

达摩院重要科技突破！空天数据库引擎Ganos解读

Ganos空天数据库引擎是李飞飞带领的达摩院数据库与存储实验室研发的新一代位置智能引擎，采用了平台即服务、多模融合、计算下推和云原生全新处理架构，为政府、企事业单位、泛互联网客户提供移动对象、空间/时空、遥感多模态数据混合存储、查询与分析服务，解决空天大数据使用流程复杂、使用门槛高、应用效率低等问题，主要应用于城市管理、交通物流、自然资源、航空航天、物联信息等领域。

# 云原生大数据计算服务 MaxCompute # 云原生数据库 PolarDB # 数知地球 AI Earth # 存储 # 人工智能 # 达摩院 # Cloud Native # 大数据 # 关系型数据库 # 定位技术 # 数据处理 # 数据库 # 索引

AI事儿

|

博文

ICASSP 2022 论文分享-CPT：语音翻译的跨模态前缀调优

ICASSP (International Conference on Acoustics, Speech, and Signal Processing) 是国际声学、语音和信号处理会议，亦为IEEE信号处理协会组织的年度旗舰会议。历届ICASSP会议都备受语音AI领域研究学者的热议和关注。本届ICASSP 2022，阿里巴巴达摩院语音实验室总共有 14 篇论文被大会接收，包含语音识别，语音合成，语音前端处理，声纹识别，语音唤醒，多模态建模等研究方向。本文介绍在语音翻译任务中，通过一个跨模态的 prefix network 来适配多语言文本预训练模型的新方式。

# 人工智能 # 自然语言处理 # 达摩院 # 前端开发 # 语音技术

阿里云OpenVI

|

博文

|

来自：视觉智能

[OpenVI-视觉生产系列之视频稳像实战篇]再见吧云台，使用AI“魔法”让视频稳定起来

随着自媒体与短视频的兴起，人们有了越来越多的拍摄视频的需求。然而由于手持拍摄、硬件限制等原因，利用手机等普通摄影设备拍摄的视频难免存在视频抖动问题。尤其是开启较高倍数的变焦后，手持拍摄很难拍摄到稳定的视频，极易产生抖动的现象。使用云台、斯坦尼康等外设可以缓解这样的抖动，但是很多时候多带一个外设降低了拍摄视频的便利程度，会使得随时随地的拍摄体验大打折扣。

# 视觉智能开放平台 # 传感器 # 机器学习/深度学习 # 人工智能 # 编解码 # 达摩院 # 算法 # 图形学

技术小达人

|

博文

ICASSP2023｜达摩院语音实验室入选论文全况速览

近日，语音技术领域国际会议ICASSP公布了本届论文审稿结果，阿里巴巴达摩院语音实验室有14篇论文被大会收录。本次被接收的论文研究方向涵盖语音识别、语音唤醒、语音增强、说话人日志、语义理解、多模态预训练等。 ICASSP (International Conference on Acoustics, Speech, and Signal Processing) 是国际声学，语音和信号处理会议，是IEEE信号处理协会组织的年度旗舰会议。历届的ICASSP会议都备受全球信号处理领域研究学者的广泛关注，ICASSP2023将于6月4号至6月10号于希腊举办。

# 日志服务 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 达摩院 # 自然语言处理 # 算法 # 搜索推荐 # 前端开发 # .NET # 测试技术 # 语音技术 # 网络架构

gs3dua33ejtbc

|

博文

|

来自： ModelScope模型即服务

达摩院开源工业级说话人识别模型CAM++

近日，达摩院正式向公众开源工业级说话人识别通用模型CAM++，兼顾准确率和计算效率，训练labels类别达20万，每类含20～200条梅尔频谱特征。当前该模型已上线Modelscope魔搭社区，后续将陆续开源针对各场景优化的工业级模型。模型下载地址：https://www.modelscope.cn/models/damo/speech_campplus_sv_zh-cn_16k-common/s

# 机器学习/深度学习 # 达摩院 # 前端开发 # 语音技术 # 开发者

编程技术君

|

博文

带你读《2022技术人的百宝黑皮书》——淘宝自研标准化协议库XQUIC正式开源！（1）

# 达摩院 # 安全 # 数据安全/隐私保护 # CDN

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

达摩院