备案控制台

开发者社区

开发者社区人工智能文章正文

Whisper 整体架构图

2024-01-25 56

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Whisper 整体架构图

`Attention`

注意力机制模块，兼容自注意力和交叉注意力。

`AttentionBlock`

Transformer 模块，包含一个自注意力，一个交叉注意力（可选）和一个 MLP 模块。

`AudioEncoder+TextDecoder`

音频编码器和文本解码器。编码器的 Transformer 模块只有自注意力，解码器的Transformer 模块有一个自注意力一个交叉注意力。

`Whisper`

Whisper 整体模型。

文章标签：

机器学习/深度学习

布客飞龙

目录

相关文章

LiBiGo

|

12月前

|

数据采集机器学习/深度学习编解码

MMdetection框架速成系列第02部分：整体算法流程+模型搭建流程+detection训练与测试核心组件+训练部分与测试部分的核心算法

众所周知，目标检测算法比较复杂，细节比较多，难以复现，而我们推出的 MMDetection 开源框架则希望解决上述问题。目前 MMdetection 已经复现了大部分主流和前沿模型，例如 Faster R-CNN 系列、Mask R-CNN 系列、YOLO 系列和比较新的 DETR 等等，模型库非常丰富，star 接近 13k，在学术研究和工业落地中应用非常广泛。

LiBiGo

1103 0 0

OpenMMLab

|

机器学习/深度学习编解码算法

超详细！手把手带你轻松掌握 MMDetection 整体构建流程(一)

作为系列文章的第一篇解读，本文主要是从整体框架构建角度来解析，不会涉及到具体算法和代码，希望通过本文讲解： - MMDetection 整体构建流程和思想 - 目标检测算法核心组件划分 - 目标检测核心组件功能

OpenMMLab

798 0 0

超详细！手把手带你轻松掌握 MMDetection 整体构建流程(一)

Deephub

|

14天前

|

机器学习/深度学习算法 atlas

RAG 2.0架构详解：构建端到端检索增强生成系统

RAG（检索增强生成）旨在通过提供额外上下文帮助大型语言模型（LLM）生成更精准的回答。现有的RAG系统由独立组件构成，效率不高。RAG 2.0提出了一种预训练、微调和对齐所有组件的集成方法，通过双重反向传播最大化性能。文章探讨了不同的检索策略，如TF-IDF、BM25和密集检索，并介绍了如SPLADE、DRAGON等先进算法。目前的挑战包括创建可训练的检索器和优化检索-生成流程。研究表明，端到端训练的RAG可能提供最佳性能，但资源需求高。未来研究需关注检索器的上下文化和与LLM的协同优化。

Deephub

47 1 1

楠竹11

|

2月前

|

机器学习/深度学习人工智能缓存

Griffin模型的主要架构和特点

【2月更文挑战第16天】Griffin模型的主要架构和特点

楠竹11

84 2 2

Griffin模型的主要架构和特点

5i77ajz5u7ji6

|

3月前

|

机器学习/深度学习存储编解码

最新轻量化Backbone | FalconNet汇聚所有轻量化模块的优点，成就最强最轻Backbone

最新轻量化Backbone | FalconNet汇聚所有轻量化模块的优点，成就最强最轻Backbone

5i77ajz5u7ji6

59 1 1

飘渺11

|

11月前

|

架构师测试技术 uml

我懂了，原来这就是4+1架构模型！

我懂了，原来这就是4+1架构模型！

飘渺11

1388 0 0

架构师研究会

|

12月前

|

uml

「应用架构」TOGAF建模之应用架构：流程/系统实现图

「应用架构」TOGAF建模之应用架构：流程/系统实现图

架构师研究会

286 0 0

架构师研究会

|

12月前

|

uml

「应用架构」应用架构之TOGAF建模：流程/系统实现图

「应用架构」应用架构之TOGAF建模：流程/系统实现图

架构师研究会

136 0 0

架构师研究会

|

12月前

|

存储 uml

「应用架构」TOGAF建模之应用架构：应用程序迁移图

「应用架构」TOGAF建模之应用架构：应用程序迁移图

架构师研究会

284 0 0

5i77ajz5u7ji6

|

12月前

|

编解码数据库

详细分析ResNet | 用CarNet教你如何一步一步设计轻量化模型（二）

详细分析ResNet | 用CarNet教你如何一步一步设计轻量化模型（二）

5i77ajz5u7ji6

146 0 0

热门文章

最新文章

订票系统不再瘫痪阿里云确认与12306合作

29.4. Maatkit Essential command-line utilities for MySQL

hdu 2051 Bitset （java）

sqlplus格式的使用

想上威胁情报？先搞明白这五个问题吧

kbmmw 中XML 操作入门

kotlin 语言入门指南(一)--基础语法

LINUX 硬连接和软连接

Android常用工具类封装---SharedPreferencesUtil

What are TCHAR, WCHAR, LPSTR, LPWSTR, LPCTSTR (etc.)?

如何本地安装AFFiNE并将服务发布至公网实现团队远程访问协作

【Linux-14】进程地址空间＆虚拟空间＆页表——原理＆知识点详解

如何在CentOS7一键安装宝塔面板并实现固定地址访问内网宝塔进行管理

【Mysql】在多表查询过程中如果已经起了别名，就不能通过表名限定字段

Windows文件搜索神器Everything安装配置结合内网穿透实现公网查询本地文件

【Web 前端】 jQuery 里的 ID 选择器和 class 选择器有何不同？

CentOS安装MeterSphere并实现无公网IP远程访问本地测试平台

【Web 前端】网页上有 5 个div元素，如何使用JQ来选择它们？

本地MinIO存储服务通过Java程序结合cpolar实现远程连接上传文件

【Web 前端】jQuery 库中的 $() 是什么？

相关课程

更多

MSE微服务测试最佳实践 - 自动化回归

使用ASK容器化部署大语言模型FastChat

微服务架构与混沌工程介绍

阿里云实时数仓实战 - 项目介绍及架构设计

模型融合方法概述

应用编排与管理核心原理

相关电子书

更多

PAI-ChatLearn 灵活易用大规模RLHF高训练框架

PAI灵骏智算构建全链路LLM服务的最佳实践

Go 构建日请求千亿级微服务的最佳实践

相关实验场景

更多

利用大模型大规模分发技术，实现AIGC在线应用秒级弹性

基于Higress构建AIGC ChatBot

云原生AI套件：五分钟微调宝可梦风格StableDiffusion

云原生AI套件：一键训练大模型及部署GPU共享推理服务

在云上部署ChatGLM2-6B大模型（GPU版）

【图生文】一键部署图像描述模型

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考