【人机对话】阿里云人工智能ET化身CEO,对话蜻蜓FM猫局长

简介: 11月29日,阿里云人工智能ET化身阿里巴巴CEO,参加蜻蜓FM猫眼未来科技局栏目,对话猫局长。人机对话,妙趣横生。

59c6ce9fb832e245d648cee39ecdc5b2276130e0


猛戳链接,直击现场:未来科技局 | 独家连线阿里巴巴未来CEO


11月29日,阿里云人工智能ET化身阿里巴巴CEO,参加蜻蜓FM猫眼未来科技局栏目,对话猫局长。人机对话,妙趣横生。

3e1f25b2dac6c6c9da791895b908a8ee962e8b17

此外,12月1日,猫眼科技连线阿里云AI专家,关于阿里云人工智能ET背后的语音识别技术进行了一次深度访谈。

猫:先请我们的科学家自我介绍一下吧?

陈:大家好我是阿里云负责ET智能语音对外服务的陈一宁。

7088e3ea8974fe9bbb875010b802c899886d8cc5

猫:你好陈工。我们看到et能言善辩还可以模仿马云的声音。这个是怎么实现的呢?

陈:模仿马云的声音这个是我们的语音合成技术。我们的语音合成技术原理是说它会根据一些已有的录音库生成一个与人的声音类似的模拟声音。那这个马云的声音实际上是因为我们收集了一些马老师在大会上的讲话之类或者是一些演讲的材料根据这个我们做了一个音库。根据这个模型生成的一个对应的马老师的语音合成的声音。

猫:语音识别在ET的各项能力中处于一个什么样的地位我看它有很多种能力啊?

陈:我认为语音识别首先是一个我们叫做听觉或者听觉中枢的一个作用它实际上是在ET的这种人机交互的过程中是一个必不可少的很重要的作用。也是相对来说一个比较成熟和比较接近产品化的一种能力。它很多时候在我们需要跟ET交互或者ET需要理性的处理一些非结构化数据的时候,语音时识别都可以帮助我们能够进入到这些数据中,能够让我们的交互可以开始发声。人机交互嘛!所以需要人说一些事情让机器去理解它。语音识别是这些理解的第一步,先把它变成文字然后才能开始做进一步的理解和进一步的交互。

猫:从现在全球的情况来看语音识别的应用情况是怎么样的从专家的角度如何看这个事情?

陈:全球来看的话语音识别应用还是比较火热的吧现在有很多种应用领域,我们一个一个来说吧比如说从这个人机交互的角度来说其实现在有很多这种助手类的产品比如苹果的siri,比如微软的小娜比如亚马逊的echo等等这样的产品。实际上都是在做这种比如手机特别是IOT设备上的语音交互产品。他们都需要语音识别的技术。那么再往下一点比如在做车载系统,如果你想跟车载做一些交互基本上智能汽车对于语音识别技术都是不可或缺的部分。同时如果对于商用的系统对于这种全球的客服比如我们民航的这种退票和改签服务应用,还有比如说在医疗领域一些医生处方或者医疗记录中发挥作用。

猫:现在语音技术还有没有面临挑战的地方阿里云是如何应对这种挑战的

陈:语音识别这个方向上我们觉得现在遇到的挑战有几种吧一个是比如说想噪声的这种挑战那么现在碰到的情况就是在干净的情况下或者说噪声很小的情况下语音识别的效果还是不错的但是在这个噪声比较大的时候这个识别率就会相对有所下降。还包括说话有一定口音的情况下。标准普通话标准语音会好一些但是有口音的情况下识别率也会有下降然后还包括说话的年龄过小或者过老也会有一些影响会打一些折扣。那么阿里云我们认为在这里面最主要的都是数据的问题。包括我们刚才讲到说抗噪声的理由识别率低实际上都是因为我们没有足够的噪声语音在里面。那么我们阿里云会采用一些技术通过人工的方式记录或者采集的方式获得大量的这种含噪声的,含口音的等等的这些语料,通过我们大规模的大数据方式做一些计算把这些海量的数据结合在一起就能够做出很多在各种情况下应用会比较好的语音识别的效果。还有提到比如中英文混杂的效果这是一个很头疼的问题那么我们也会通过各种识别材料增加的方式来达到最终的满意度。

猫:给我们能不能讲几个科学家工程师们的小故事让大家都了解一下他们的付出。了解工程师们是如何努力的?

陈:试试看啊我讲一个前线落地的故事不是一个后台的故事落地的时候我们会碰到一个很正常的问题有时候我们在做语音识别相关的工作的时候有一个事情很重要就是录音质量要好。录音如果本身就有巨大的噪声或者是你根本就没录下来那么肯定这个效果就会不好吧那这个就会有问题我举个例子比如说之前我们在这个湖南卫视我是歌手》这个节目里头去预测这个歌王。我们现场要得到歌手演唱的这些数据那么这样的一些东西我们都需要把声音录下来都录下来以后发现我们跟电视台的设备做的一些连接我们的设备和电台的设备是不兼容的。插上来基本上就是烧设备。然后当时很紧急的要拔掉开始直播了就发现这个设备有问题。然后后来紧急的想了各种办法来解决。从湖南卫视借了他们的一些设备出来才把这个事儿最后解决的这种情况还有很多比如说在双11晚会的过程中。也会遇到这种设备插在一起还会遇到这种电流电源上的干扰这种声音录起来是完全没法听这样的情况都有很多这种需要现场的工程师去解决,他们有时候都是没日没夜加班连轴转,把公司当做自己的家,非常的辛苦。



相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
13天前
|
JSON 分布式计算 数据处理
加速数据处理与AI开发的利器:阿里云MaxFrame实验评测
随着数据量的爆炸式增长,传统数据分析方法逐渐显现出局限性。Python作为数据科学领域的主流语言,因其简洁易用和丰富的库支持备受青睐。阿里云推出的MaxFrame是一个专为Python开发者设计的分布式计算框架,旨在充分利用MaxCompute的强大能力,提供高效、灵活且易于使用的工具,应对大规模数据处理需求。MaxFrame不仅继承了Pandas等流行数据处理库的友好接口,还通过集成先进的分布式计算技术,显著提升了数据处理的速度和效率。
|
4天前
|
人工智能 运维 Kubernetes
阿里云容器服务AI助手2.0 - 新一代容器智能运维能力
2024年11月,阿里云容器服务团队进一步深度融合现有运维可观测体系,在场景上覆盖了K8s用户的全生命周期,正式推出升级版AI助手2.0,旨在更好地为用户使用和运维K8S保驾护航。
|
7天前
|
机器学习/深度学习 存储 人工智能
2024阿里云AI交出答卷,全球领先!
2024阿里云AI交出答卷,全球领先!
53 9
2024阿里云AI交出答卷,全球领先!
|
8天前
|
存储 人工智能 数据管理
|
7天前
|
人工智能 云计算
官宣!阿里云成为总台春晚云计算AI独家合作伙伴
官宣!阿里云成为总台春晚云计算AI独家合作伙伴
154 22
|
3天前
|
人工智能 JSON 算法
魔搭支持在阿里云人工智能平台PAI上进行模型训练、部署了!
现在,魔搭上的众多模型支持在阿里云人工智能平台PAI-Model Gallery上使用阿里云算力资源进行模型训练和部署啦!
|
15天前
|
机器学习/深度学习 人工智能 运维
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
阿里云技术公开课预告:Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
116 2
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
|
6天前
|
机器学习/深度学习 人工智能 安全
阿里云先知安全沙龙(武汉站) ——AI赋能软件漏洞检测,机遇, 挑战与展望
本文介绍了漏洞检测的发展历程、现状及未来展望。2023年全球披露的漏洞数量达26447个,同比增长5.2%,其中超过7000个具有利用代码,115个已被广泛利用,涉及多个知名软件和系统。文章探讨了从人工审计到AI技术的应用,强调了数据集质量对模型性能的重要性,并展示了不同检测模型的工作原理与实现方法。此外,还讨论了对抗攻击对模型的影响及提高模型可解释性的多种方法,展望了未来通过任务大模型实现自动化漏洞检测与修复的趋势。
|
1天前
|
人工智能 运维 监控
阿里云Milvus产品发布:AI时代云原生专业向量检索引擎
随着大模型和生成式AI的兴起,非结构化数据市场迅速增长,预计2027年占比将达到86.8%。Milvus作为开源向量检索引擎,具备极速检索、云原生弹性及社区支持等优势,成为全球最受欢迎的向量数据库之一。阿里云推出的全托管Milvus产品,优化性能3-10倍,提供企业级功能如Serverless服务、分钟级开通、高可用性和成本降低30%,助力企业在电商、广告推荐、自动驾驶等场景下加速AI应用构建,显著提升业务价值和稳定性。
|
1天前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。