微软发布Project Oxford,供Azure户免费集多项功能

简介:
昨天 Build Day1 Keynote 一开始的时候,有人说它被红衣主教 Scott Guthrie 变成了 Azure 展销会,当然这么理解其实没什么问题。

  后续的 Section 里,微软公开了 Project Oxford 服务,主要为 Azure 用户免费提供图像、语音识别等智能 REST API 和 SDK。

  这一服务由微软研究院(MSR)主导开发,其为开发者提供的模型都由微软现有其它产品中使用的深度学习和机器学习技术训练得到。

  Project Oxford 目前为止提供图像识别 API、人脸识别 API、语音识别/处理 API 和名为 "LUIS" 的语义识别服务四类功能。其中:

Image title

Image title

  • 图像识别 API 提供图像分析、OCR 和智能缩略图获取(智能提取图片主体)等功能。

Image title

Image title

Image title

Image title

  • 人脸识别 API 则提供人脸检测、人脸验证、分组和身份认定等功能。

Image title

Image title

Image title

  • 语音处理/识别 API 提供语音转文字和文字转语音两种服务。其后端与 Cortana 的识别引擎相同。发布之初语音转文字提供 7 种语言支持,文字转语音提供 17 种。

Image title

Image title

  • LUIS (Language Understanding Intelligent Service)服务提供语义分析、实体检测和自学习模型特性。

  此前我们采访机器学习/深度学习界泰斗 Alan Yuille 时,他提到微软研究院是目前商业公司内几乎唯一一个纯以学术为目的的研究性机构,本次微软将 MSR 多年的积累提供给开发者,无疑是给创业公司们一个信号:别再折腾自己造轮子了,直接买个 Azure 然后专心做产品吧。

  消息来源:Channel 9(现场 Keynote 也能从本链接下载)、Project Oxford 项目地址

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
开发者
这款酷似飞书文档的工具开源了,支持私有部署!!!
这个酷似飞书文档的工具真的非常好用,体验和飞书差不多,同样支持 Markdown 语法,经常使用 Markdown 写文档的同学一定要试试了,相信你一定会喜欢上它,这个工具是我用差不多20天左右的时间开发的,而且它的前后端项目现在都已经开源了,如果你能帮我推广那我更是感激不尽。所以,如果你想有一个可以私有部署的文档工具,而且体验还特别棒的的,那就快来试试这个吧,相信它不会让你失望的。
1208 0
|
5月前
|
存储 API 虚拟化
VMware产品问题之整合其产品以提供统一的产品门户体验如何解决
VMware产品问题之整合其产品以提供统一的产品门户体验如何解决
34 0
|
7月前
|
存储 Web App开发 自然语言处理
免费可二次开发的私有网盘开源项目(筛选2024年仍活跃发版)
阿里最新开源大模型通义千问Qwen2性能大幅提升,支持128K tokens,免费开放,有望推动企业数字化转型。然而,中文互联网封闭趋势可能导致优质语料减少,影响模型效果。未来大模型发展可能依赖技术大厂和私有语料结合。文中列举了2024年活跃的开源私有网盘项目,如Syncthing、AList、Nextcloud等,为企业内部文档管理和知识库建设提供选择。
|
存储 运维 小程序
基于腾讯云开发小程序(新闻发布及共享平台)中
基于腾讯云开发小程序(新闻发布及共享平台)中
159 0
基于腾讯云开发小程序(新闻发布及共享平台)中
|
缓存 小程序 应用服务中间件
MrDoc免费的团队文档系统
MrDoc免费的团队文档系统
826 0

热门文章

最新文章