微软发布Project Oxford,供Azure户免费集多项功能

简介:

昨天 Build Day1 Keynote 一开始的时候,有人说它被红衣主教 Scott Guthrie 变成了 Azure 展销会,当然这么理解其实没什么问题。

  后续的 Section 里,微软公开了 Project Oxford 服务,主要为 Azure 用户免费提供图像、语音识别等智能 REST API 和 SDK。

  这一服务由微软研究院(MSR)主导开发,其为开发者提供的模型都由微软现有其它产品中使用的深度学习和机器学习技术训练得到。

  Project Oxford 目前为止提供图像识别 API、人脸识别 API、语音识别/处理 API 和名为 "LUIS" 的语义识别服务四类功能。其中:

Image title

Image title

  • 图像识别 API 提供图像分析、OCR 和智能缩略图获取(智能提取图片主体)等功能。

Image title

Image title

Image title

Image title

  • 人脸识别 API 则提供人脸检测、人脸验证、分组和身份认定等功能。

Image title

Image title

Image title

  • 语音处理/识别 API 提供语音转文字和文字转语音两种服务。其后端与 Cortana 的识别引擎相同。发布之初语音转文字提供 7 种语言支持,文字转语音提供 17 种。

Image title

Image title

  • LUIS (Language Understanding Intelligent Service)服务提供语义分析、实体检测和自学习模型特性。

  此前我们采访机器学习/深度学习界泰斗 Alan Yuille 时,他提到微软研究院是目前商业公司内几乎唯一一个纯以学术为目的的研究性机构,本次微软将 MSR 多年的积累提供给开发者,无疑是给创业公司们一个信号:别再折腾自己造轮子了,直接买个 Azure 然后专心做产品吧。




本文转自数据之巅博客园博客,原文链接:http://www.cnblogs.com/asxinyu/articles/4469655.html,如需转载请自行联系原作者

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
前端开发
实战:第十八章:facebook和google免登接入
实战:第十八章:facebook和google免登接入
107 0
实战:第十八章:facebook和google免登接入
|
存储 运维 小程序
基于腾讯云开发小程序(新闻发布及共享平台)中
基于腾讯云开发小程序(新闻发布及共享平台)中
145 0
基于腾讯云开发小程序(新闻发布及共享平台)中
|
存储 JavaScript 数据挖掘
微软行星云计算Microsoft Planetary Computer 账号内测申请开通和如何根据自己的需求配置电脑环境(R/python/GIS等)
微软行星云计算Microsoft Planetary Computer 账号内测申请开通和如何根据自己的需求配置电脑环境(R/python/GIS等)
327 0
微软行星云计算Microsoft Planetary Computer 账号内测申请开通和如何根据自己的需求配置电脑环境(R/python/GIS等)
|
自然语言处理 IDE 程序员
Jetbrains即将推出下一代编辑器:Fleet,对标 VS Code,内含官方申请链接!
Jetbrains即将推出下一代编辑器:Fleet,对标 VS Code,内含官方申请链接!
724 0
Jetbrains即将推出下一代编辑器:Fleet,对标 VS Code,内含官方申请链接!