• 关于

    语音识别如何看配置

    的搜索结果
  • 体验 Vista Speech Recognition,使梦想成为可能

    还记得我们经常在电影里看到的一个场景么?某人在操作计算机时不单单只是使用键盘或鼠标与计算机进行对话,而是使用语音来直接控制操作计算机,这便是语音识别技术。这项技术其实很早就已经开始在使用,但是应用面却非常有限。早期我们只是通过语音识别来输入文字或进行简单的人机交互操作,随着多媒体应用技术的发展,硬...

    文章 像教授 2017-11-26 879浏览量

  • DFSMN在阿里巴巴的应用以及如何采用开源代码训练DFSMN模型

    本文作者:镭铭,谵良 DFSMN模型是语音识别中一种先进的声学模型,语音识别中的声学模型是语音识别技术中的核心所在。具体来说,声学模型是根据输入语音进行发音可能性的识别,结合语言模型、解码器,就构成了完整的语音识别系统。本次开源的DFSMN模型,是阿里巴巴的高效工业级实现,相对于传统的LSTM、...

    文章 tramp_zsl 2018-06-11 8159浏览量

  • INTERSPEECH 2017系列 | 远场语音识别技术

    编者:今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术、系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场。从10月25日开始,阿里iDST语音团队和云栖社区将共同打造一系列语音技术分...

    文章 坤承 2017-11-27 6666浏览量

  • 3月16日云栖精选夜读:显著超越流行长短时记忆网络,阿里提出DFSMN语音识别声学模型

    在语音顶会ICASSP,阿里巴巴语音交互智能团队的poster论文提出一种改进的前馈序列记忆神经网络结构,称之为深层前馈序列记忆神经网络(DFSMN)。研究人员进一步将深层前馈序列记忆神经网络和低帧率(LFR)技术相结合,构建LFR-DFSMN语音识别声学模型。 热点热议 显著超越流行长短时记...

    文章 yq传送门 2018-03-16 2665浏览量

  • INTERSPEECH 2017系列 | 语音识别技术之声学模型

    编者:今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术、系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场。从10月25日开始,阿里iDST语音团队和云栖社区将共同打造一系列语音技术分...

    文章 tramp_zsl 2017-12-02 5366浏览量

  • 从声学模型算法角度总结 2016 年语音识别的重大进步

    免费开通大数据服务:https://www.aliyun.com/product/odps  在过去的一年中,语音识别再次取得非常大的突破。IBM、微软等多家机构相继推出了自己的 Deep CNN 模型,提升了语音识别的准确率;Residual/Highway 网络的提出使我们可以把神经网络训练的...

    文章 隐林 2017-02-13 8465浏览量

  • 思必驰携手博泰,共创智能汽车新声代

    思必驰必将为用户努力提供拥有更加极致丰富的智能体验的语音交互产品,与博泰共同打造汽车智能语音新声代。 据数据显示,到2023年之前智能车载的渗透率将会超过50%。同时,智能语音交互也必然会汽车的标准配置。而近年来跨平台开放合作浪潮愈演愈烈。相互借力,孕育新的市场机会是未来互联网商业模式发展的必...

    文章 头条资讯 2019-04-17 116浏览量

  • 重磅!MaxCompute助力阿里开源自研语音识别模型DFSMN,准确率高达96.04%

    阿里开源语音识别模型DFSMN 在近期举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。 著名语音识别专家,西北工业大学教授谢磊...

    文章 隐林 2018-06-22 2623浏览量

  • 人机交互新进展:LFR-DFSMN语音识别声学模型介绍

    语音识别技术是人机交互技术的重要组成部分,而语音识别中的声学模型是语音识别技术中的核心所在,堪称重中之重。阿里巴巴iDST智能语音交互团队最新的LFR-DFSMN模型相对于之前的LFR-LCBLSTM模型可以达到训练加速3倍、识别加速2倍、识别错误率降低20%和最终模型大小压缩50%的效果,实现了...

    文章 tramp_zsl 2017-10-20 7212浏览量

  • 重磅!阿里开源自研语音识别模型DFSMN,准确率高达96.04%

    阿里开源语音识别模型DFSMN 在近期举行的云栖大会武汉峰会上,装有DFSMN语音识别模型的“AI收银员”在与真人店员的PK中,在嘈杂环境下准确识别了用户的语音点单,在短短49秒内点了34杯咖啡。此外,装备这一语音识别技术的自动售票机也已在上海地铁“上岗”。 著名语音识别专家,西北工业大学教授谢磊...

    文章 技术小能手 2018-06-08 5349浏览量

  • 解密蚂蚁金服MISA:37℃的自助语音交互是怎么做到的?

    什么是IVR IVR(interactive voice response)即互动式语音应答,由PC机(或工控机)、电话接口卡、语音板(语音处理卡)和传真卡组成。通过IVR系统,客户可以利用音频按键电话或语音输入信息,通过录音导航从该系统中获得预先录制的数字、语音或合成语音信息。IVR作为呼叫中心...

    文章 兔子酱 2018-04-13 1607浏览量

  • 最强大脑“人机大战”第二轮战平,吴恩达详解背后技术原理

    如果说在上一轮人机大战的人脸识别对决中,由于小度对阵了并不擅长人脸识别的王峰,令比赛意义打了折扣,那么昨天进行的第二轮声音识别的人机大战,虽然最终只是战平,但对于AI 界的意义却似乎更大。 原因有两点:一、公认实力顶尖的对手;二、业界公认困难的比赛内容。 在对手上,此次迎战百度小度的是名人堂公认最...

    文章 云栖大讲堂 2017-08-01 1153浏览量

  • 情绪识别如何拯救你的生命? | 硬创公开课

    嘉宾介绍: 赵京雷,阅面科技 ReadSense CEO。上海交通大学人工智能博士,前WiseNut研究中心算法负责人,前阿里北京算法研究中心负责人、高级算法专家。阅面科技专注于深度学习和计算机视觉,为消费级智能机器提供最前沿的视觉算法和解决方案。其技术应用领域包括服务机器人、智能家电、智能手机、...

    文章 青衫无名 2017-08-01 1499浏览量

  • 也许是国内最全“智能音箱”评测,教你如何选 AI 音箱?

    本文授权转载自公众号声学在线(微信号:soundonline),作者木京,原标题为《视频 | 国内最全的“智能音箱”评测,教你如何选 AI 音箱?》。声学在线专注于声学与人工智能技术创新与行业发展。 智能音箱大战早已在硅谷打响,如今,这场战火也点燃了中国市场。井喷式发展的中国智能音箱市场已经成为了...

    文章 玄学酱 2017-11-07 1474浏览量

  • 从“扫月亮”到“扫福字”,扒一扒背后的支付宝AR框架体系

    摘要:从攒五福到抢红包,全国人民的春节活动越来越多样,其背后技术挑战也更复杂:业务层挑战与实现方案、AR红包支付架构变化、技术难点和攻克手段、优化细节和保障方法、安全风险和攻防实战等,每一年的红包背后,如果能拍摄出来,都将是一部技术大片。在云栖社区2017红包技术峰会上,蚂蚁金服技术专家承智为大家...

    文章 场景研读 2017-02-27 5947浏览量

  • 如何用人机协同提高客服效率?阿里巴巴客服助手诞生了

    小叽导读:阿里巴巴经济体每天都在服务着数以亿计的会员,每天会员求助的进线量巨大,尽管机器人的解决能力已经很强大,但是以目前技术人工客服依然无法完全被替代,庞大的阿里人工客服在保障会员体验的任务中仍扮演着十分重要的角色。阿里巴巴新零售技术事业群-CCO技术部打造了一款助手在客服工作中予以辅助,实现人...

    文章 初商 2019-08-15 935浏览量

  • 快手科技李岩:多模态技术在产业界的应用与未来展望

    快手 +2 AI影响因子 活动 企业:快手 操作:主题演讲 事项: 雷锋网(公众号:雷锋网) AI 科技评论按:在 CNCC2018「高通量媒体内容理解论坛」上,快手科技多媒体内容理解部负责人李岩发表了题为「多模态内容生产与理解」的演讲,讲述了带领多媒体内容理解部...

    文章 雷锋网 2018-11-09 229浏览量

  • 一文看尽科大讯飞年度发布会:医疗,是这家A股AI公司的新赛道

    本文来自AI新媒体量子位(QbitAI) 一年一度,科大讯飞总会通过年终发布会,披露一年成绩,发布最新战略。 与去往年不同,自AlphaGo在2016年横空出世之后,人工智能狂飙突进,以语音起家的科大讯飞,也成了A股市场最受关注的人工智能公司。 即便伴随一些营收、盈利方面的争议,但讯飞年度发布...

    文章 行者武松 2018-01-01 1587浏览量

  • 阿里AI Labs王刚解读9小时卖出百万台的“天猫精灵” | 高山大学(GASA)

    *以下根据王刚2017年11月14日在高山大学(GASA)思享课II期的分享整理而成 在刚刚过去的“双十一”购物狂欢节中,短短9个小时之内“天猫精灵”智能音箱的销量突破了100万台,阿里掀起的这场价格战背后足以看出其对智能音箱市场的重视。在11月14日的高山大学(GASA)思享课II期,阿里巴巴人...

    文章 技术小能手 2017-11-23 2322浏览量

  • GPU训练的快速大规模分布式扩展-GPU多机多卡Machine Learning Middleware

    在其他同学的文章中已经介绍过了,阿里新的自动语音识别系统的第一个落地点,被选定在客服电话语音识别上。这个落地项目非常难,首先就在于我们面对的语音数据非常多样化:比如各种随意的对话、不完整的句子、各种话题以及各种传输差异和环境噪声。面对如此复杂的语音数据,我们后端的语音识别声学模型就一定要尽可能的覆...

    文章 镭铭 2016-03-28 14626浏览量

  • 苹果大秀AI肌肉:详解Core ML框架及智能音箱HomePod

    本文来自AI新媒体量子位(QbitAI) “I love machine learning, especially since I’m a machine, learning. ” —— Siri 与Google相比,今天凌晨的苹果全球开发者大会(WWDC)节奏超快。 苹果一口气连续发布...

    文章 行者武松 2018-01-19 975浏览量

  • 如何利用阿里云打造感知零售平台

    一、背景介绍所谓感知零售是指的根据店铺顾客的情绪变化以及顾客在店铺内对商品货架停留位置来判断顾客对商品感兴趣程度,实时在线调整营销策略。帮助企业第一时间掌握顾客感受,第一时间下发营销策略,第一时间得到营销效果反馈。传统企业和零售商要完成这样一套系统构建,往往需要投入大量的人力物力和时间,而且有些传...

    文章 云攻略小攻 2018-02-28 2798浏览量

  • 人工智能的时代来了,新的商业机会在哪里?

    提起人工智能,大多数人脑子里首先跳出的可能是这些问题,人工智能会使人类都失业吗?人工智能真的可以有自我意识以及情感吗?机器人会毁灭世界吗?人工智能离我们还很遥远吧? 但事实是,人工智能的时代已经到来了,它就在我们身边。   打开手机,大量的应用已经有了人工智能的影子:比如你对某一类的资讯内容感兴趣...

    文章 【方向】 2018-08-22 1701浏览量

  • 阿里云视觉智能API,核心技术一站共享!

    随着人工智能的技术不断成熟,AI技术已应用到了社会的各行各业,尤其是计算机视觉技术应用更为广泛,计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学,计算机视觉智能技术试图创建能够从图像视频或者多维数据中获取“信息和知识”的人工智能系统。作为AI技术的主要组成部分,计算机视...

    文章 小攻云攻略 2020-02-26 335浏览量

  • Fire TV上手体验:语音搜索,想说爱你不容易

      【编者按】亚马逊的机顶盒发布后,人们的关注达到了前所未有的高潮,它的确有许多可圈可点的地方。但是到底表现如何?于是我收集了一些上手体验以供参考。 界面 第一次安装Fire TV时,你得忍受一段由抽象男介绍的冗长视频。嗯,对于小白或者祖母级别人物来说这个还是挺需要的,毕竟里面也包含了不少功能...

    文章 boxti 2017-08-30 1092浏览量

  • 阿里云双11访谈之视频云

    以下内容根据访谈视频整理而成 今天视频已经成为最具互动性的网络内容。相比文字和图片,视频可以承载的内容更加丰富也更加生动,人们也已经习惯通过视频这种内容形态来表达自己的想法,传递自己的思想,进行社交以及了解我们的世界。视频成为一种主流的内容表达方式,站在视频服务和开发者角度,我们更多关注如何支撑业...

    文章 场景研读 2017-10-31 2399浏览量

  • 《企业大数据系统构建实战:技术、架构、实施与应用》一第3章 企业大数据解决方案3.1 企业大数据解决方案实现方式

    本节书摘来自华章出版社《企业大数据系统构建实战:技术、架构、实施与应用》一书中的第3章,第3.1节,作者吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问云栖社区“华章计算机”公众号查看 第3章 企业大数据解决方案 企业在开展大数据战略时,往往面临多种实施解决方案的路径可供选择。由于企业需求、背...

    文章 华章计算机 2017-05-02 4090浏览量

  • 阿里云视觉智能API,核心技术一站共享!

    随着人工智能的技术不断成熟,AI技术已应用到了社会的各行各业,尤其是计算机视觉技术应用更为广泛,计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学,计算机视觉智能技术试图创建能够从图像视频或者多维数据中获取“信息和知识”的人工智能系统。作为AI技术的主要组成部分,计算机视...

    文章 云攻略小攻 2020-02-26 1486浏览量

  • 数加平台如何通过Serverless 架构实现普惠大数据

     阿里云大数据 Serverless 理念 Serverless是一种架构理念,指的是以服务的形式来提供计算能力而不是以服务器形式,让开发者在构建应用的过程中不用过多考虑基础设施的问题。大数据业务本来就是最典型的计算业务,从计算的场景上来说,涵盖了离线批量计算、实时流计算、在线实时计算等,在很多情...

    文章 班输 2016-09-07 5869浏览量

  • 阿里云视觉智能 API,核心技术一站共享!

    --------点击屏幕右侧或者屏幕底部“+订阅”,关注我,随时分享机器智能最新行业动态及技术干货------------ 背景:阿里巴巴集团内的视觉智能基石 视觉智能技术相比其它 AI 类技术(语音语言等),功能流派更多,场景也更复杂 。整个阿里巴巴经济体围绕着自身大量业务场景(电商零售、金融物...

    文章 机器智能技术 2020-02-28 397浏览量

1 2 3 4 ... 8 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT