他们用AI,让大山里的孩子也能「说好」普通话

简介: 他们用 AI 帮助千千万万个「丁真」学习普通话,走出大山,走向更好的未来。

「我的家在四川甘孜州理塘县,就住在格聂雪山脚下。在我们村庄,每天推开门就能看见格聂雪山。这就是我的世界……」 伴随着「丁真」的名字火遍全国,理塘也越来越为人所熟知。

image.png雪山、草原、冰川、寺庙、白塔…… 这里有着如画的风景,无愧于它「天空之城」的称号。但受制于交通、地理、海拔等因素,不少生活在山区的儿童仍然缺乏与外界的连接。部分地区的素养教育资源分配不均匀,且网络信息良莠不齐,很多山区儿童缺乏良好的学习普通话的条件。 普通话对于下一代的教育尤为重要。听得懂普通话,才有机会学习到更多的知识,也能带动更多当地大人说普通话,从而达到 “小手拉大手” 的目的。

那么,如何帮助山区儿童学习课外知识、提高普通话水平?如何为他们提供素养提升的正规渠道?在近日落幕的第二届腾讯 Light・公益创新挑战赛上,一款名为「语言海洋泡泡」的获奖作品,吸引了不少人的目光。 在「泡泡」里学习普通话

「对于我们来说,讲普通话是一件很简单的事情,毕竟我们从小在城市中长大,接受的教育都是以普通话进行的。但是在山区和更偏远的地方,孩子们用来交流的是他们的方言,学习普通话的氛围是不足的。」在决赛路演中,北辰之星团队成员分享了自己的感悟。

北辰之星团队的成员来自国内外的几所高校。这些年轻人中,年龄最大的只有 24 岁,此外还包括两位 00 后成员。虽然身处不同的地区,但他们在读书期间都参加过一些关于普通话推广的公益项目。

也是这些社会实践给了他们一些启发。在一次面向理塘当地的调研中,一位团队成员曾在藏民家中与其家庭成员进行交谈,他观察到,接受普通话教育的年龄阶段、环境,对一个人学习普通话的水平具备关键影响。

「藏民家有三个女儿,年龄最小的女儿普通话说得最流利,也是最喜欢说普通话的。在藏区,青壮年说普通话的人数要比老年人的人数更多。」

但在一些偏远的地区,小朋友要想获得充分的基础普通话学习渠道极其不易。

假如以小游戏的形式,设计一款普通话教学产品呢?基于这样的灵感,几位成员一拍即合,决定为偏远地区的儿童打造一款寓教于乐、提升普通话水平的趣味公益应用。 「语言海洋泡泡」主要为留守儿童、贫困地区儿童以及未能完全掌握普通话的学生所设计,为他们提供一个纯净的素养教育平台。「对于孩子来说,他们对世界的好奇心就像泡泡一样,在阳光下会折射出美丽的色彩。」 为了更好地激发 3-6 岁儿童的学习兴趣,团队决定用「泡泡」作为核心功能的形态。软件设置了「生活小能手」、「安全我最棒」、「蔬果故事会」三个版块,小朋友们可以在掌握生活常识、自我保护、健康饮食三个领域知识的同时提升普通话水平。


image.png

在整个跟读环节,「语言海洋泡泡」首先利用「一句话识别」功能对儿童语音进行转换识别,再利用「句子相似度」进行评判。产品还会根据孩子的普通话水平,智能匹配相应的学习音频,助力儿童高效学习普通话。 这种「开盲盒」的玩法确实极具吸引力:进入产品界面后,小朋友只需要选择其中一个泡泡,点击「收听」、「我来说一遍」、「点击再听一次」,就能完成跟读学习。

image.gif

「语言海洋泡泡」这个项目希望通过科技的方式帮助孩子们边玩边学,在学习中提高说普通话的信心。在目前的功能中,任何用户都能够在「语言海洋泡泡」中提交新的泡泡,为丰富语料库贡献自己的力量。

640 (4).gif

神奇泡泡的最强技术助攻

从 2022 上半年开始,「语言海洋泡泡」产品得到了现任中共理塘县委常委、副县长 (挂职) 叶小明的支持。来自杭州钱塘新区的叶县,希望并认同用科技帮助孩子多说普通话。目前,「语言海洋泡泡」产品已在理塘县开展试点运用,当地越来越多的幼儿园已经加入到「语言海洋泡泡」的队伍里。

团队也提到,根据调查统计,85% 以上的人对语音识别系统的功能表示满意。

image.png


那么,这样一款寓教于乐的公益产品,是怎么打造的呢?在决赛路演中,团队成员分享了搭建「语言海洋泡泡」的过程。

实际上,几位成员之前并没有自然语言处理产品的项目经验。在这个过程中,腾讯云担任了「最强技术助攻」的角色,提供了关键的语音识别技术支持。

「语言海洋泡泡」的核心落地场景在于跟读过程的语音对比,在每一个泡泡下,都包含一条 10 秒之内的普通话教学语音。团队翻阅了很多学龄前儿童的书籍,收集到几千条可用素材,而这些语料也大多是团队成员自己录制的。

团队成员提到,基于腾讯云开放的「实时语音识别」和「一句话识别」两项功能,他们不再需要从零开始设计算法,直接调用 API 就能实现产品的语音识别功能,大大减少了项目手写代码的工作量。

于是,他们把精力主要放在了语料库的搭建上:尽管在最初录入的过程中,语料的总体识别精确度仅在 80% 左右。但经过一周内的语料库更新和多次测试,团队将精确度迅速提升到了 90% 以上。

从落地效果上看,目前中小词汇量非特定人语音识别系统识别精度已经大于 98%,同时「一句话识别」与自然语言处理中的「语言相似度识别」功能已经非常成熟,精准度与稳定性均可得到保证。  此外,腾讯云的微搭平台提供了很多现成的行业化模板、拖拽式组件和可视化配置,即便此前完全没有接触过语音领域的工作,使用者也能快速融会贯通。

一位负责开发的成员表示:「这样一来,我们就可以把更多的时间放在产品功能的实现上,省去了代码上的很多基础工作。」

image.png

按照团队成员们的规划,未来的「语言海洋泡泡」会包含更多有趣的功能,比如泡泡收藏、用户排行榜、排位赛等。同时,这款产品也会借助推荐算法,不断提高用户接收知识难度,比如说从简单的一句话进化为绕口令,帮助孩子们不断提升普通话水平。

目前,腾讯云的 AI 语音识别技术已经支持中、英、粤、川、韩、日等多个语种,涵盖通用、音视频、金融、医疗、游戏等领域。基于腾讯云开放的众多技术能力,团队也展开了更多想象,比如加入语言互通的功能,包括藏英、藏汉语言互通。

「或许三、四岁的小朋友还意识不到学好普通话的长远意义,但看到这些孩子能够开心地使用产品,能够边玩边学、真正有所收获,我们就很感动了。」团队成员表示。

image.png

围观了决赛路演全程之后,可以发现,所有入围决赛的选手都提到了一个关键词:腾讯云。 如「北辰之星」团队一般,借助腾讯云提供的各项技术能力,各个团队的成员们即使没有太多的技术经验,「一键调用」就能完成产品搭建。 比如「悦智 AI 实验室」团队开发了专注于新生儿黄疸识别的「保健熊」小程序,目前已植入广州市卫健委官方公众号「广州健康通」,为全广州市的新生儿提供黄疸随访健康保障。小程序使用了腾讯云 AI 的图像识别技术后,黄疸识别模型准确率提升到了 97%。 致力于河狸保护的团队「阿尔泰山地区自然保护协会」,则使用腾讯云的 AI 图像识别等技术,开发了一款新应用,能够快速识别红外相机拍摄的动物种类。过去人工需要 2、3 个月甚至半年时间的审核工作,现在仅需要两天,对观测新栖息地的生物多样性和栖息地生态环境打造效果起到了关键作用。 这两支团队获得了本届挑战赛的公益创新大奖,还将分别获得 20 万人民币奖励、20 万腾讯云微搭奖励(代金券)以及 20 万腾讯云 AI 奖励(资源包)。

腾讯云副总裁、腾讯优图实验室总经理吴运声表示,在腾讯 Light· 公益创新挑战赛中,我们希望看到更多参赛选手和开发者能够从社会生活中发现问题、并通过腾讯云提供的  AI 等技术能力来解决这些问题。 写到这里,那么对于腾讯自身来说,又为何要举办这样一场公益创新挑战赛?也许,腾讯 Light・公益创新挑战赛正是腾讯推动云上 AI「技术价值外溢」的重要动作。 2020 年底,腾讯可持续社会价值事业部创新办学实验室、腾讯优图实验室、腾讯云 AI、企鹅伴成长、企鹅爱地球等联合发起了首届腾讯 Light・公益创新挑战赛,赛题主要关注儿童保护、适老化、生物多样性保护等社会痛点问题。 这一公益技术赛事迄今已连续举办两届。面向行业开发者、公益爱好者,腾讯决定开放腾讯云上的 AI 技术,并充分发挥腾讯的技术能力与平台链接资源,扶持优秀项目,以科技创新的方式满足各领域的公益需求,探索人工智能与更广泛的社会价值的结合。 依托腾讯优图实验室等顶级人工智能机构,腾讯云已开放超过 300 多项 AI 原子能力、80+AI 行业解决方案,其中,腾讯云 AI 在公有云日处理图像超 50 亿张,日处理语音超 250 万小时,日处理自然语言超千亿句,服务全球用户数超过 12 亿。

多年来深耕产业互联网的技术积淀和落地经验,就是腾讯推动「技术价值外溢」的底气。

去年第二届腾讯 Light・公益创新挑战赛的启动仪式上,腾讯高级执行副总裁、云与智慧产业事业群 CEO 汤道生曾说过:「服务于人,是人工智能最大的价值,用 AI 助力更美好的世界,这样的探索存在于实验室里,存在于产业中,也正走向更广阔的社会应用中。」 为了实现这一愿景,腾讯已经搭好了服务社会的公益平台。一年一度的大赛圆满落幕了,但科技与公益的故事,仍然未完待续。


相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
人工智能 大数据 vr&ar
把AI课堂搬进大山
把AI课堂搬进大山
299 9
|
人工智能 大数据 vr&ar
把AI课堂搬进大山
把AI课堂搬进大山
|
人工智能 机器人 语音技术
神器 | 全新AI配音工具,专治普通话不标准!
比如:上面的视频中,给大家演示了三种配音场景——儿童故事、伤感文字、新闻播报。你听出来了吗?
1316 1
|
8月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
2073 77
|
9月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1633 87
|
8月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
814 30
|
8月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
821 2
|
8月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
8月前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
509 3