|
机器学习/深度学习 人工智能 数据可视化
|

视觉GPT | SegGPT:大通用分割模型登场!利用视觉 prompt 分割万物

视觉GPT | SegGPT:大通用分割模型登场!利用视觉 prompt 分割万物

1089 0
|
机器学习/深度学习 算法 搜索推荐
|

CVPR2023 | 结合二进制编码器的人脸年龄估计模型

CVPR2023 | 结合二进制编码器的人脸年龄估计模型

557 0
|
机器学习/深度学习 移动开发 编解码
|

Skip-Attention:一种能显著降低Transformer计算量的模型轻量化方法

Skip-Attention:一种能显著降低Transformer计算量的模型轻量化方法

1120 0
|
机器学习/深度学习 iOS开发 计算机视觉
|

iOS MachineLearning 系列(16)—— 几个常用的图片分类CoreML模型

对于图片识别分类的模型来说,其输入和输出都一样,输入都为图像参数,输入为两部分,一部分为最佳预测结果,一部分为可能得预测结果及其可信度。

655 0
|
机器学习/深度学习 编解码 人工智能
|

超越DALL·E!| OpenAI 年度最新力作 GLIDE:新生代文本引导扩散模型

超越DALL·E!| OpenAI 年度最新力作 GLIDE:新生代文本引导扩散模型

624 0
|
机器学习/深度学习 人工智能 测试技术
|

一文深度剖析扩散模型究竟学到了什么?

一文深度剖析扩散模型究竟学到了什么?

174 0
|
机器学习/深度学习 移动开发 编解码
|

即插即用系列 | Skip-Attention:一种能显著降低Transformer计算量的模型轻量化方法

即插即用系列 | Skip-Attention:一种能显著降低Transformer计算量的模型轻量化方法

504 0
|
前端开发
|

网页前端学习第四次(HTML)——css常用属性、css盒子模型

网页前端学习第四次(HTML)——css常用属性、css盒子模型

217 0
|
人工智能 供应链 物联网
|

AI大模型来袭,智能家居迎新拐点?

AI大模型来袭,智能家居迎新拐点?

385 1
|
机器学习/深度学习 达摩院 前端开发
|

达摩院开源工业级说话人识别模型CAM++

近日,达摩院正式向公众开源工业级说话人识别通用模型CAM++,兼顾准确率和计算效率,训练labels类别达20万,每类含20~200条梅尔频谱特征。当前该模型已上线Modelscope魔搭社区,后续将陆续开源针对各场景优化的工业级模型。

2081 0
|
机器学习/深度学习 数据采集 人工智能
|

零门槛玩转AI声音定制,3分钟即可复刻你的发音模型

零门槛玩转AI声音定制,3分钟即可复刻你的发音模型

2262 0
|
机器学习/深度学习 并行计算 算法
|

ICASSP 2023论文模型开源|语音分离Mossformer

人类能在复杂的多人说话环境中轻易地分离干扰声音,选择性聆听感兴趣的主讲人说话。但这对机器却不容易,如何构建一个能够媲美人类听觉系统的自动化系统颇具挑战性。 本文将详细解读ICASSP2023本届会议收录的单通道语音分离模型Mossformer论文,以及如何基于开发者自有数据进行该模型的调优训练。

895 0
|
人工智能 语音技术 开发者
|

【答开发者问】魔搭ModelScope语音技术社区2月QA集锦

自ModelScope发布以来,语音AI技术开源模型受到众开发者朋友们的关注和使用。感谢开发者们在社区的技术交流群内热烈地讨论和提出宝贵建议。 本文整理了2月份开发者们提问较多或普遍存疑的问题,并进行解答,以供后续开发者们参考,亦欢迎开发者们进入社区与我们常交流。

274 0
|
人工智能 算法 前端开发
|

开源|如何使用ModelScope训练自有的远场语音唤醒模型?

就像人和人交流时先会喊对方的名字一样,关键词就好比智能设备的"名字",而关键词检测模块则相当于交互流程的触发开关。 本文介绍魔搭社区中远场语音增强与唤醒一体化的语音唤醒模型的构成、体验方式,以及如何基于开发者自有数据进行模型的定制。

1684 0
|
机器学习/深度学习 人工智能 达摩院
|

魔搭语音更新|七大模型最新开源,推理速度升级,几行代码可实现微调

自ModelScope魔搭社区发布以来,众开发者在ModelScope上传与下载模型,并集成到自己的语音识别服务中。为了方便用户更好地利用ModelScope进行语音识别服务,我们推出了语音识别基础框架FunASR,希望在语音识别的学术研究和工业应用之间架起一座桥梁。FunASR已经集成到ModelScope中,提供的工业级的语音识别模型的推理与微调定制,使得研究人员和开发者可以更加便捷的进行语音识别模型的研究和生产,促进语音识别生态的发展。

1200 0
|
达摩院 自然语言处理 测试技术
|

开源|业界首个应用落地的非自回归端到端语音识别模型,推理效率可提升10倍

近期,阿里巴巴达摩院发布新一代语音识别模型Paraformer,这是业界首个应用落地的非自回归端到端语音识别模型,在推理效率上最高可较传统模型提升10倍,且识别准确率在多个权威数据集上名列第一。 目前,该模型于魔搭社区面向全社会开源,适用语音输入法、智能客服、车载导航、会议纪要等众多场景。

1073 0
|
达摩院
|

三分钟视频|看懂达摩院语音降噪模型训练全过程

三分钟视频|看懂达摩院语音降噪模型训练全过程

351 0
|
达摩院 语音技术
|

三分钟视频|看懂达摩院新一代语音识别模型训练全过程

三分钟视频|看懂达摩院新一代语音识别模型训练全过程

329 0

三分钟视频|看懂口语语言处理模型训练全过程

三分钟视频|看懂口语语言处理模型训练全过程

127 0
|
机器学习/深度学习 人工智能 达摩院
|

EMNLP 2022论文解读 | SOND:基于显式语音重叠建模的说话人日志模型

Empirical Methods in Natural Language Processing (EMNLP)是由国际计算语言学协会(Association for Computational Linguistics, ACL)举办的自然语言处理和人工智能方面的重量级国际会议,历届会议都会受到全球各地人工智能领域人士的广泛关注。 近期,阿里巴巴达摩院语音实验室的论文“Speaker Overlap-aware Neural Diarization for Multi-party Meeting Analysis”被EMNLP 2022 主会长文接收。该论文展现了达摩院语音实验室在多方会议分

652 0
|
语音技术
|

三分钟视频|看懂多情感语音合成模型训练过程

三分钟视频|看懂多情感语音合成模型训练过程

260 0
|
开发者
|

入驻ModelScope,一起魔搭吧(内附多项开发者权益)

入驻ModelScope,一起魔搭吧(内附多项开发者权益)

259 0
|
机器学习/深度学习 达摩院 Shell
|

如何使用魔搭ModelScope快速定制一款对长文本进行理解的模型?

‍本文详细介绍PoNet模型的原理以及其在ModelScope上的体验用法,包括PoNet简介原理、PoNet在ModelScope上怎么用、PoNet在各种下游任务上的效果等。

661 0
|
人工智能 达摩院
|

【报名】2022年第17届全国人机语音通讯学术会议--魔搭专场技术沙龙

达摩院联合CCF开源发展委员会共同发起了国内首个中文AI模型开源社区--魔搭ModelScope,汇集了当前业界各类模态的领先模型,以及丰富的数据集,并吸引各大科研机构和科技公司来分享共建这一社区,方便科研工作者做横向的比较和研究,并共同推进技术创新和原创性模型研究的发展。 本届全国人机语音通讯学术会议——魔搭专场(线上)技术沙龙,将邀请魔搭ModelScope社区语音语义AI的贡献者和合作伙伴一同进行模型解读演示以及如何快速训练定制各类语音模型。

242 0
|
机器学习/深度学习 人工智能 达摩院
|

WeNet入驻魔搭Modelscope,助推开源语音社区协同创新

继杭州云栖大会,阿里达摩院携手 CCF 开源发展委员会共同推出 AI 模型社区“魔搭” ModelScope以来,达摩院率先向魔搭社区贡献 300 多个经过验证的优质 AI 模型,进行了全面开源开放。澜舟科技、深势科技、智谱 AI等合作机构亦在社区开源业界领先模型,包括视觉、语音、自然语言处理、多模态等 AI 主要方向,并向 AI for Science 等新领域积极探索,覆盖的主流任务超过 60 个。

706 0
|
达摩院 大数据 关系型数据库
|

如何使用ModelScope魔搭训练工业级语音识别模型

如何使用ModelScope魔搭训练工业级语音识别模型

1575 0
|
人工智能 达摩院 Linux
|

如何使用ModelScope魔搭开源代码训练一款语音合成模型

如何使用ModelScope魔搭开源代码训练一款语音合成模型

1521 0
|
机器学习/深度学习 编解码 缓存
|

如何用ModelScope训练出一个语音降噪模型?

如何用ModelScope训练出一个语音降噪模型?

799 0
|
人工智能 达摩院 自然语言处理
|

阿里达摩院五年磨一剑,重磅推出AI模型社区,直击“AI应用难”

11月3日,2022云栖大会杭州现场,阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,旨在降低AI的应用门槛。达摩院率先向魔搭社区贡献300多个经过验证的优质AI模型,超过1/3为中文模型,全面开源开放,并且把模型变为直接可用的服务。

819 0
|
云栖大会
|

2022云栖大会 | ModelScope模型社区分论坛即将重磅发布(11月3日)

2022云栖大会 | ModelScope模型社区分论坛即将重磅发布(11月3日)

564 0
|
机器学习/深度学习 自然语言处理 大数据
|

INTERSPEECH 2022论文解读|Paraformer: 高识别率、高计算效率的单轮非自回归端到端语音识别模型

INTERSPEECH 是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议。历届 INTERSPEECH 会议都备受全球各地语音语言领域人士的广泛关注。 本文介绍一种具有高识别率与计算效率的单轮非自回归模型 Paraformer。该论文已被 INTERSPEECH 2022 接收。

1199 0
|
机器学习/深度学习 人工智能 自然语言处理
|

视觉大模型DINOv2:自我监督学习的新领域

本文将介绍DINOv2是如何改进的,以及这些进步可能对整个领域有什么影响。

1880 0
|
人工智能 自然语言处理 机器人
|

《花雕学AI》34:用13种Prompt玩转AI聊天机器人—揭秘ChatGPT模型

如何提高聊天机器人的交互性和创造性呢?有没有一些技巧或方法可以帮助聊天机器人更好地生成不同类型的回复呢?答案是有的。这就是ChatGPT的13种Prompt。这些Prompt是一些用来引导聊天机器人生成不同类型的回复的技巧。它们可以帮助聊天机器人更好地理解用户的意图,提供更有趣、更有创意、更有逻辑的回复。 在本文中,我们将介绍ChatGPT的13种Prompt的概念和作用,并举例说明如何使用它们来和聊天机器人进行愉快和有意义的对话。

1158 0
|
编解码 自然语言处理 计算机视觉
|

缩小规模,OpenAI文本生成图像新模型GLIDE用35亿参数媲美DALL-E

缩小规模,OpenAI文本生成图像新模型GLIDE用35亿参数媲美DALL-E

338 0
|
机器学习/深度学习 人工智能 自然语言处理
|

7 Papers & Radios | OpenAI文本生成图像新模型GLIDE;培养皿中百万人脑细胞打乒乓(2)

7 Papers & Radios | OpenAI文本生成图像新模型GLIDE;培养皿中百万人脑细胞打乒乓

176 0
|
机器学习/深度学习 自然语言处理 并行计算
|

7 Papers & Radios | OpenAI文本生成图像新模型GLIDE;培养皿中百万人脑细胞打乒乓(1)

7 Papers & Radios | OpenAI文本生成图像新模型GLIDE;培养皿中百万人脑细胞打乒乓

244 0
|
自然语言处理 计算机视觉
|

多模态学习加持,蛋白质预训练模型S2F准确预测PPI

多模态学习加持,蛋白质预训练模型S2F准确预测PPI

302 0
|
机器学习/深度学习 数据采集 人工智能
|

站在2022前展望大模型的未来,周志华、唐杰、杨红霞这些大咖怎么看?

站在2022前展望大模型的未来,周志华、唐杰、杨红霞这些大咖怎么看?

207 0
|
PyTorch 测试技术 调度
|

只需几个小操作,就能让transformer模型推理速度加3.5倍

只需几个小操作,就能让transformer模型推理速度加3.5倍

554 0
|
自然语言处理 计算机视觉
|

单一ViT模型执行多模态多任务,谷歌用协同训练策略实现多个SOTA

单一ViT模型执行多模态多任务,谷歌用协同训练策略实现多个SOTA

733 0
|
机器学习/深度学习 人工智能 自然语言处理
|

用Transformer定义所有ML模型,特斯拉AI总监Karpathy发推感叹AI融合趋势

用Transformer定义所有ML模型,特斯拉AI总监Karpathy发推感叹AI融合趋势

163 0
|
存储 人工智能 安全
|

增大模型依然有用,DeepMind用2800亿参数的Gopher,测试语言系统极限

增大模型依然有用,DeepMind用2800亿参数的Gopher,测试语言系统极限

277 0
|
机器学习/深度学习 人工智能 自然语言处理
|

1.2万亿参数:谷歌通用稀疏语言模型GLaM,小样本学习打败GPT-3

1.2万亿参数:谷歌通用稀疏语言模型GLaM,小样本学习打败GPT-3

425 0
|
机器学习/深度学习 Web App开发 自然语言处理
|

7 Papers & Radios | DeepMind推出2800亿参数模型;剑桥团队首次检测到量子自旋液体(2)

7 Papers & Radios | DeepMind推出2800亿参数模型;剑桥团队首次检测到量子自旋液体

235 0
|
存储 机器学习/深度学习 人工智能
|

7 Papers & Radios | DeepMind推出2800亿参数模型;剑桥团队首次检测到量子自旋液体

7 Papers & Radios | DeepMind推出2800亿参数模型;剑桥团队首次检测到量子自旋液体

252 0
|
机器学习/深度学习 人工智能 监控
|

一个模型处理多种模态和任务,商汤等提出Uni-Perceiver,迈向通用预训练感知模型

一个模型处理多种模态和任务,商汤等提出Uni-Perceiver,迈向通用预训练感知模型

378 0
|
人工智能 自然语言处理 文字识别
|

一招入魂 | CLIPPO:利用Transformer建立多模态模型新范式!

一招入魂 | CLIPPO:利用Transformer建立多模态模型新范式!

435 0
|
机器学习/深度学习 人工智能 测试技术
|

一文深度剖析扩散模型究竟学到了什么?

一文深度剖析扩散模型究竟学到了什么?

301 0
|
编解码
|

SINE: 一种基于扩散模型的单图像编辑解决方案

SINE: 一种基于扩散模型的单图像编辑解决方案

237 0
|
敏捷开发 Web App开发 运维
|

软件测试之基础概念学习篇(需求 + 测试用例 + 开发模型 + 测试模型 + BUG)

1. 什么是软件测试 2. 软件测试和软件开发的区别 3. 软件测试和软件调试的区别 4. 什么是需求 1)以需求为依据设计测试用例 5. 测试用例是什么 6. 什么是 BUG(软件错误) 7. 五个开发模型 1)瀑布模型 2)螺旋模型 3)迭代模型、增量模型 4)敏捷开发模型 8. 测试模型 1)V 模型 2)W 模型 9. 软件测试的生命周期(软件测试的流程) 10. 如何描述一个 BUG 11. BUG 的级别 1)崩溃 2)严重 3)一般 4)建议(次要) 12. BUG 的状态转移图

616 0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

0
今日
14399
内容
6
活动
3684
关注
你好!
登录掌握更多精彩内容

相关产品

  • 人工智能平台 PAI
  • 文字识别
  • 智能语音交互