多领域 ASR 英语语料库——GigaSpeech 基本介绍

简介: 附有效下载教程
❤️ 【专栏:数据集整理】❤️ 之【有效拒绝假数据】

👋 Follow me 👋,一起学更多有趣 AI、冲冲冲 🚀 🚀

📔 基础信息

0-论文

本文介绍了 GigaSpeech,这是一个不断发展的多领域英语语音识别语料库,具有 10,000 小时适合监督训练的高质量标记音频,以及 40,000 小时适合半监督和无监督训练的总音频。大约 40,000 小时的转录音频首先从有声读物、播客和 YouTube 中收集,涵盖阅读和自发说话风格,以及各种主题,如艺术、科学、体育等。提出了一种新的强制对齐和分割管道创建适合语音识别训练的句段,并过滤掉转录质量低的句段。对于系统训练,GigaSpeech 提供了五个不同大小的子集,10h、250h、1000h、2500h 和 10000h。对于我们的 10,000 小时 XL 训练子集,我们将过滤/验证阶段的单词错误率上限为 4%,而对于所有其他较小的训练子集,我们将其上限为 0%。另一方面,DEV 和 TEST 评估集由专业的人工转录员重新处理,以确保高转录质量。为流行的语音识别工具包提供了基线系统,即 Athena、ESPnet、Kaldi 和 Pika。

📕 数据集介绍

备注:该部分内容属于截图整理

声明:本部分数据集介绍摘自——清华语音与音频技术实验室

0-1
0-2
0-3
0-4
0-5
0-6

声明:本部分数据集介绍摘自——清华语音与音频技术实验室

致敬各位大佬

0-7

📘 下载正确打开方式

🟧 下载主页 申请入口如下

1-0

🟨 填写必要信息

1-1

🟦 提交成功界面如下

如果填写有误,还可重新编辑

1-2

🟧 很快邮箱收到下载方式说明

查阅你的邮箱,会得到类似这样的回复
Dear moli,

Thank you for agreeing to GigaSpeech's terms of access. A copy of your agreement has also been attached at the end of this email. To download GigaSpeech:

 1. Clone the GigaSpeech repo
 
  Run: git clone https://github.com/SpeechColab/GigaSpeech.git

 2. Create password file under GigaSpeech/SAFEBOX

  这里会有一个加密解密的命令需要运行

 3. Download Gigaspeech
 
  3.1 Make sure you have at least 1.2T of free space under the destination directory
  3.2 Run: bash utils/download_gigaspeech.sh YOUR_DESTINATION_DIRECTORY

Regards,
The SpeechColab Team
1.2T 空间,先去清理下磁盘吧

3-0

📙 致敬大佬

感谢诸位为全人类的人工智能事业添砖加瓦

3-5

更多语音数据集博文总结如下
近期经典有趣博文推荐

📙 博主 AI 领域八大干货专栏、诚不我欺

📙 预祝各位 2022 前途似锦、可摘星辰

🎉 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️
❤️ 过去的一年、大家都经历了太多太多、祝你披荆斩棘、未来可期

9-9

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
存储 SQL 运维
TIDB和MySQL的区别
TIDB和MySQL的区别
2299 0
|
缓存 Java Shell
【alibaba/jvm-sandbox#06】事件监听的关键设计
介绍jvm-sandbox中事件机制的设计,通过用事件Id与事件之间的映射关系进行解耦,通过Spy类的静态方法携带事件Id进行核心事件逻辑的埋点注入
769 0
|
7月前
|
SQL 前端开发 关系型数据库
如何开发一套研发项目管理系统?(附架构图+流程图+代码参考)
研发项目管理系统助力企业实现需求、缺陷与变更的全流程管理,支持看板可视化、数据化决策与成本优化。系统以MVP模式快速上线,核心功能包括需求看板、缺陷闭环、自动日报及关键指标分析,助力中小企业提升交付效率与协作质量。
|
6月前
|
人工智能 监控 算法
睡岗检测/睡觉检测数据集(2000张图片已划分、已标注)轻松上手目标检测训练
本数据集包含2000张已标注睡岗行为图片,涵盖多种真实场景,适用于YOLO等目标检测模型训练。专为安防、工业值守、交通监控等智能识别场景设计,助力快速构建睡岗检测系统,推动AI在安全领域的落地应用。
1062 12
睡岗检测/睡觉检测数据集(2000张图片已划分、已标注)轻松上手目标检测训练
|
12月前
|
存储 监控 安全
无需云服务器、无需公网IP,轻松实现门禁系统远程接入与数据同步
智慧园区门禁管理中,贝锐花生壳提供高效解决方案。通过内网穿透技术,无需公网IP即可集中管理多区域门禁系统,保障数据安全传输。采用RSA与AES混合加密,支持权限精细化控制及多维度监控,简单三步实现远程访问,助力园区智慧安全管理升级。
558 7
|
存储 监控 Java
深入理解计算机内存管理:优化策略与实践
深入理解计算机内存管理:优化策略与实践
|
中间件 测试技术 数据库
开发人员之软件开发流程八个步骤
软件开发流程是指软件开发设计的一般流程,包括软件的总体结构、模块的组成、功能的设计、程序的编译、调试、联调、测试等过程。
1550 2
|
Oracle Unix 关系型数据库
在Linux中,什么是Linux操作系统,它的特点是什么?
在Linux中,什么是Linux操作系统,它的特点是什么?
|
人工智能 自然语言处理 算法
阿里云PAI大模型评测最佳实践
在大模型时代,模型评测是衡量性能、精选和优化模型的关键环节,对加快AI创新和实践至关重要。PAI大模型评测平台支持多样化的评测场景,如不同基础模型、微调版本和量化版本的对比分析。本文为您介绍针对于不同用户群体及对应数据集类型,如何实现更全面准确且具有针对性的模型评测,从而在AI领域可以更好地取得成就。
|
Ubuntu NoSQL 数据安全/隐私保护
如何在在虚拟机中安装Ubuntu
如何在在虚拟机中安装Ubuntu
821 0