语音技术

首页 标签 语音技术
# 语音技术 #
关注
7009内容
【深度学习之美】人工“碳”索意犹尽,智能“硅”来未可知(入门系列之二)
现在的人工智能,大致就是用“硅基大脑”模拟或重现“碳基大脑的过程”。那么,在未来会不会出现“碳硅合一”的大脑或者全面超越人脑的“硅基大脑”呢?专家们的回答是“会的”。而由深度学习引领的人工智能,正在开启这样的时代。
阿里云首席科学家周靖人:数据智能引领产业变革
1024,是开发者的节日。云栖社区也准备了一份特别的礼物:《2016杭州云栖大会回顾专题》,共计325+份PDF下载,100+场峰会与分论坛视频点播的专题送给大家!也欢迎朋友们将参会感受、学习笔记等共享给我们。
盘它!40篇+阿里技术经典案例,看完必收藏(上)
很多小伙伴在后台发信息,表示一天一篇技术干货看不过瘾。这里统一回复下:阿里妹去年偷偷开了个“小号”,叫做“阿里巴巴机器智能”(据说很多读算法的博士同学都在关注),平时会发AI领域的阿里经典案例,同样期待小伙伴们的关注。
深度学习训练,选择P100就对了
本文使用NVCaffe、MXNet、TensorFlow三个主流开源深度学习框架对P100和P40做了图像分类场景的卷积神经网络模型训练的性能对比,并给出了详细分析,结论是P100比P40更适合深度学习训练场景。
GPU训练的快速大规模分布式扩展-GPU多机多卡Machine Learning Middleware
我们设计了GPU多机多卡middleware,使得单机版机器学习程序可以通过插入middleware较快的实现基于ASGD或MA的多机多卡训练,此前各自基于open source工具所做的独有修改都可以得以充分保留。
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
想学习高大上的深度学习技术么?快来看看这本书
本文简单介绍了 Goodfellow 所著的《深度学习》的主要内容,非常透彻地分析了该书的优缺点以及适用群体。想学习深度学习么?快来看看吧。
阿里巴巴开源语音识别声学建模技术
本文我们介绍阿里巴巴的语音识别声学建模新技术: 前馈序列记忆神经网络(DFSMN)。目前基于DFSMN的语音识别系统已经在法庭庭审识别、智能客服、视频审核和实时字幕转写、声纹验证、物联网等多个场景成功应用。
阿里人工智能实验室王刚:找到合适的应用场景是实现人工智能商业化的关键点
王刚博士是今年3月加入阿里人工智能实验室的,在此之前,他在南洋理工大学担任副教授(终身教授),专注于深度学习的研究,是众多转投工业界的学术专家之一。
免费试用