覆盖16省方言的老人语音数据集!SeniorTalk:智源研究院开源全球首个超高龄老年人中文语音数据集

简介: SeniorTalk是由智源研究院与南开大学联合推出的全球首个中文超高龄老年人对话语音数据集,包含202位75岁及以上老年人的55.53小时语音数据,涵盖16个省市的不同地域口音。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🎙️ "75+老人语音识别准确率翻倍!全球首个中文高龄数据集开源,覆盖16省方言"

大家好,我是蚝油菜花。当AI语音助手在年轻人中普及率超过80%时,你是否发现这些"黑科技"对家中老人依然不够友好?

这些场景可能让你揪心过:

  • 👵 奶奶用方言问天气,智能音箱却回复"正在为您订购外卖"
  • 🏥 爷爷的咳嗽声被误听成指令,半夜自动拨通了120
  • 📞 视频通话时AI降噪过度,把老人的关键病情描述当成了背景杂音...

今天要介绍的 SeniorTalk ,正在改变老年语音技术的困境!这个由智源研究院×南开大学打造的数据集:

  • 填补全球空白:专攻75-85岁高龄群体,202位老人55小时真实对话
  • 方言保护计划:覆盖16省口音,连"哩语"和气息声都被完整收录
  • 科研级标注:精确到词级时间戳+重叠语音标记,错误率直降63%

已有团队用它开发出适老语音识别系统,准确率提升47%——你家的智能设备,是时候真正"听懂"长辈了!

🚀 快速阅读

SeniorTalk是专为75岁以上高龄老年人设计的语音数据集。

  1. 数据规模:包含202位老人55.53小时语音,覆盖16省市方言。
  2. 技术价值:提供词级时间戳、口音标签等多维度标注。
  3. 应用前景:支持语音识别、健康监测等适老化技术研发。

SeniorTalk 是什么

SeniorTalk

SeniorTalk 是智源研究院联合南开大学计算机学院人类语言技术实验室(HLT Lab)推出的全球首个中文超高龄老年人对话语音数据集。数据集包含202位75岁及以上超高龄老年人的语音数据,总时长达到 55.53小时。

数据采集覆盖16个省市,涵盖不同地域口音,基于两两自发对话的方式,话题涉及退休、健康、生活等,贴近真实交流场景。数据集包含多维度精细标注,如说话人信息、对话内容转写、时间戳(句子级和词级)、口音类别标签等。

SeniorTalk 的主要功能

  • 语音识别:提升超高龄老年人语音识别的准确率,助力开发更精准的语音识别系统。
  • 说话人验证:支持说话人验证技术研究,确保语音交互的安全性和可靠性。
  • 说话人分离:提供多说话人的对话数据,助力说话人分离技术研究。
  • 语音编辑:提供自然对话数据,支持语音编辑技术研究,改善语音合成效果。
  • 健康监测:分析超高龄老年人语音特征,支持健康监测技术研究。

SeniorTalk 的技术原理

  • 数据采集:基于两两自发对话方式,用多种智能手机进行录音,确保数据多样性。
  • 数据标注:包含说话人信息、对话内容转写、时间戳等多维度人工标注。
  • 数据处理:采用16kHz采样率的WAV文件格式,分为训练集、验证集和测试集。
  • 技术应用:基于Transformer等模型提升语音识别性能,应用X-vector等模型进行说话人研究。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
12月前
|
机器学习/深度学习 自然语言处理 语音技术
字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言(Python3.10)
按照固有的思维方式,如果想要语音克隆首先得有克隆对象具体的语言语音样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语音克隆技术。 coqui-ai TTS实现跨语种、无需训练克隆语音的方法是基于Tacotron模型,该模型使用了一种音素输入表示来鼓励在不同语种之间共享模型容量。此外,还引入了对抗损失项,以鼓励模型将说话者身份与语音内容进行解耦。这使得模型能够在不同语种之间进行语音合成,而无需在任何双语或平行示例上进行训练。
字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言(Python3.10)
|
1月前
|
数据采集 人工智能 自然语言处理
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
ChildMandarin是由智源研究院与南开大学联合推出的开源语音数据集,包含41.25小时3-5岁儿童普通话语音数据,覆盖中国22个省级行政区,为儿童语音识别和语言发展研究提供高质量数据支持。
151 20
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
|
6月前
|
人工智能 安全 算法
上交大、上海人工智能实验室开源首个多轮安全对齐数据集 SafeMTData
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。
|
3月前
|
人工智能 物联网 测试技术
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
小红书开源的工业级自动语音识别模型,支持普通话、中文方言和英语,采用 Encoder-Adapter-LLM 和 AED 架构,实现 SOTA 性能。
934 17
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
VMB:中科院联合多所高校推出多模态音乐生成框架,能够通过文本、图像和视频等多种输入生成音乐
VMB(Visuals Music Bridge)是由中科院联合多所高校机构推出的多模态音乐生成框架,能够从文本、图像和视频等多种输入模态生成音乐。该框架通过文本桥接和音乐桥接解决了数据稀缺、跨模态对齐弱和可控性有限的问题。
145 7
VMB:中科院联合多所高校推出多模态音乐生成框架,能够通过文本、图像和视频等多种输入生成音乐
|
5月前
|
数据采集 自然语言处理 数据处理
智源研究院发布中文高质量数据集CCI3.0-HQ技术报告
智源研究院发布了CCI3.0-HQ中文预训练数据集,采用先进的混合质量过滤方法,显著提升数据完整性和性能。该数据集在多项实验中表现优异,超越了其他主流中文语料库。同时,智源还推出了CCI3-HQ分类器,大幅改进了大语言模型训练中的数据选择流程。
157 12
智源研究院发布中文高质量数据集CCI3.0-HQ技术报告
|
8月前
|
语音技术 网络架构
首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜
【9月更文挑战第6天】近年来,人工智能技术的进步推动了文本到语音(TTS)系统的高质量语音生成能力。针对现有TTS系统在中文方言生成上的不足,研究人员开发了Bailing-TTS模型。此模型利用大规模数据集与连续半监督学习方法,结合特定的Transformer架构及多阶段训练流程,实现了自然流畅的方言语音合成。实验结果显示,Bailing-TTS在客观和主观测试中均能生成接近真实的人类发音,并具备零样本学习能力。尽管仍面临复杂方言质量和多样性等挑战,但Bailing-TTS为中文方言语音合成提供了新的可能,并有望在未来技术发展中发挥更大作用。
760 1
|
9月前
|
存储 自然语言处理 监控
FunAudioLLM在性能、功能、技术先进性等方面与国际知名语音大模型的比较
FunAudioLLM在性能、功能、技术先进性等方面与国际知名语音大模型的比较
|
11月前
|
人工智能 自然语言处理 语音技术
GigaSpeech 2:三万小时东南亚多语种语音识别开源数据集发布
GigaSpeech 2 是一个持续扩展的、多领域多语言的大规模语音识别语料库,旨在促进低资源语言语音识别领域的发展和研究。
|
12月前
|
数据采集 存储 人工智能
蚂蚁集团联合上海仁济医院泌尿科发布国内首个临床专科推理数据集:RJUA-QA
详细介绍数据集的构建过程、特点及统计分析,并全面评测了行业和通用大模型在该数据集上的性能,后续团队将持续优化数据集,为人工智能在医疗领域的研究与应用提供有力支持。
蚂蚁集团联合上海仁济医院泌尿科发布国内首个临床专科推理数据集:RJUA-QA

热门文章

最新文章