智能语音交互

首页 标签 智能语音交互
# 智能语音交互 #
关注
2595内容
语音唤醒技术:small-footprint keyword spotting
目前市场上推出了各式各样的音箱、机器人、车载等语音交互产品,语音识别是交互的入口,而语音唤醒成为了踏进这一入口的第一步,如何高效、准确地对用户指令给出反应成为这一技术的最重要目标。iDST资深语音算法工程师陈梦喆将介绍语音唤醒技术的基础知识,基本技术架构以及国内外最新研究成果。
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
飞天 AI 平台重磅发布!阿里拥抱 AI 这五年
2014 年,一个名为“iDST”的神秘部门的诞生开启了阿里的人工智能新征程,5 年后,初长成的达摩院成为了阿里 AI 崛起的代表性力量。如今,阿里已跻身全球人工智能技术研发的第一梯队,成为时下这 AI 技术洪流中不可或缺的力量。这份出彩的“成绩单”背后,是阿里 AI 团队过去 5 年的筹谋、坚守与突破。在杭州召开的阿里巴巴云栖大会上,AI 悄然占据 C 位,新任“阿里云智能计算平台掌门人”贾扬清、阿里巴巴达摩院机器智能实验室负责人金榕、阿里巴巴达摩院语音实验室负责人鄢志杰等三十几位达摩院技术专家在大会第二天发布了阿里在 AI 领域的最新研究进展和成果。
FreeSWITCH 语音识别 ASR 模块
最近很多人都对FreeSWITCH和ASR对接比较感谢兴趣,(,考虑到大部分人,只是研究一下,并不准确购买商业模块,特意做一个开源项目给大家提供一个参考。
免费试用