巩固图像和物体识别领域领导地位:谷歌出新招

本文涉及的产品
图像搜索,7款服务类型 1个月
简介:

Google里有远见的领导者已经向其计算机里注入了他们的愿景。

为了支撑其已经引人瞩目的图像和物体识别领域的领导地位,搜索巨头并购了法国创业公司Moodstocks,该公司擅长于智能手机里的基于机器学习的图像识别技术。

“我们的梦想是将摄像头调优成智能传感器来赋予机器眼睛,让它们能够感知周围的环境,” Moodstocks在其声明中这么说。

Google收购Moodstocks是其“人才并购”中的最新手笔,这样的并购涉及基于机器学习的图像识别,这是计算机视觉领域的核心组件。Amazon在今年初收购Orbeus、Twitter几周前收购了Magic Pony Technology,这起收购发生在这之后,这反映出了业界观察家们所描述的科技领导者间的竞争,他们都在尝试加速商业化下一个计算机相关的前沿领域。

“科技公司已经投资了大量时间和金钱来理解互联网文本,”Forrester Research的首席分析师Mike Gualtieri在一封邮件里写到。“他们现在想要理解图像,这十分自然。通过文字和图像的组合意思所能够提供出的AI,不仅仅能够理解文字(语音),而且能够进行图像识别。”

比如,Google已经传闻在开发能够让用户仅仅用图像作为搜索词,直接从照片里进行搜索的功能。Google希望能够利用Moodstocks的人才力量——他们将会加入Google位于巴黎的现有的研究和开发团队,来帮助进一步推进计算视觉领域的研究。

“我们已经在视觉识别方面有了很大的成功,” Vincent Simonet写到,他是Google法国研究和开发中心的老大,“但是该领域还有很多事情需要完成。”

大数据引领图像识别的新纪元

Google Photos——以及Facebook,Flickr和其他处理图像分类和标记的公司,已经在后台采用了先进的图像识别技术,但是“这些方案还能够更快,更高效,并且要求更少的训练资源,” Tomasz Malisiewicz博士也同意这一点,他是Magic Leap Inc.深度学习领域的首席软件工程师,这是一家位于佛罗里达州的致力于增强现实技术的创业公司。

“在图像识别的全新的深度学习时代里,计算视觉团队的整个概念都在被重构,” Malisiewicz说。“当算法开发还依靠人工的时候,拥有强大的博士团队来引导开发是十分重要的。但是随着深度学习软件的商业化,大部分开发人员都能够使用今年最流行的神经网络架构来训练识别模型。”

这个新时代的图像识别领域里至关重要的就是数据——大量数据。

“关注点已经从算法设计本身转移到大规模数据管理上,因为性能最好的模型要求海量的数据,” Malisiewicz说。

重构视觉世界

对于公司而言,除了海量数据之外,这里面还有些什么?分析师指出,基于机器学习的图像识别用例不仅仅是简单的分类,比如找到个人家庭照片或者在购物分类里缩小产品类型。

该技术拥有变革医疗行业的可能性,比如,通过医疗图像帮助医生诊断疾病。另外,增强和虚拟现实的可穿戴设备需要使用摄像头来感知周围的世界,能够受益于图像识别和改进的跟踪功能,Malisiewicz说。

基于机器学习的图像识别能够帮助企业自动化运维功能,比如监控,实地检测以及其他任何涉及持续或者周期性检查的事情,Forrester的Gualtieri说。

计算视觉领域的进步所带来的可操作数据开启了企业盈利的新机遇,Matthew Zeiler这么认为,他是Clarifai的创始人和CEO,这是一家擅长于视觉识别的AI公司。

“他们还能够从之前未标记的信息源里收集信息,这些信息源是没有任何描述,元数据或者标签的图像和视频,”他补充道。

还会带来一些其他的好处。计算视觉仍然是相对新的领域,积极探索很重要,密歇根大学电子工程和计算机科学的副教授Jason Corso博士说。

“很重要的一点是,要注意到这些进步和商业案例很少涉及可能的市场和问题。我们的世界是视觉世界;对于未来的先进技术而言,利用这个世界的丰富性是非常重要的,”他说。





====================================分割线================================


本文转自d1net(转载)

目录
相关文章
|
8月前
|
机器学习/深度学习 编解码 人工智能
麻省理工AI新研究可将马赛克变视频
【2月更文挑战第30天】麻省理工学院等机构的研究团队推出AI新技术FeatUp,可将低分辨率图像提升为高清视频,该技术在2024年ICLR会议上引起关注。FeatUp基于深度特征提取,通过多视角一致性损失恢复空间信息,提高视频清晰度。模型通用性强,适用于多种任务和现有应用。实验显示,它在图像超分辨率和端到端学习模型性能提升上超越其他方法。然而,尚存在对某些内容处理不完善和计算资源需求高的局限性。
125 2
麻省理工AI新研究可将马赛克变视频
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
Genesis:卡内基梅隆大学联合 20 多所研究机构开源生成式物理引擎,能够模拟各种材料、物体和物理运动现象
Genesis是由卡内基梅隆大学联合20多所研究机构开源的生成式物理引擎,能够模拟世界万物,具有高度的物理准确性和快速的模拟速度,适用于机器人仿真、游戏开发、电影特效制作等多个领域。
100 21
Genesis:卡内基梅隆大学联合 20 多所研究机构开源生成式物理引擎,能够模拟各种材料、物体和物理运动现象
|
2月前
|
人工智能 计算机视觉 网络架构
OpenAI攻克扩散模型短板,清华校友路橙、宋飏合作最新论文
扩散模型在生成AI领域取得显著成果,但其训练不稳定性和采样速度慢限制了发展。OpenAI与清华校友合作,提出连续时间一致性模型(CMs),通过TrigFlow等创新解决了这些问题,大幅提升了训练稳定性和计算效率,实现了与最优模型相当的样本质量,同时减少了计算资源消耗。
47 2
|
7月前
|
人工智能 算法 安全
“AI黏土人”一夜爆火,图像生成类应用何去何从?
【6月更文挑战第1天】“AI黏土人”一夜爆火,图像生成类应用何去何从?
|
8月前
|
数据采集 人工智能 算法
微软最新 Sora 分析论文,从中可以看到 Sora 未来的发展方向在哪里?
【2月更文挑战第17天】微软最新 Sora 分析论文,从中可以看到 Sora 未来的发展方向在哪里?
99 2
微软最新 Sora 分析论文,从中可以看到 Sora 未来的发展方向在哪里?
|
Web App开发 机器学习/深度学习 人工智能
用魔法打败魔法!一个叫板顶级人类棋手的围棋AI输给了它的同类
用魔法打败魔法!一个叫板顶级人类棋手的围棋AI输给了它的同类
104 0
|
机器学习/深度学习 计算机视觉
大视觉模型方向,计算机视觉顶尖期刊 IJCV 特刊征稿
大视觉模型方向,计算机视觉顶尖期刊 IJCV 特刊征稿
200 0
|
机器学习/深度学习 数据可视化 数据挖掘
CVPR 2023|哈工大南洋理工提出全球首个「多模态DeepFake检测定位」模型:让AIGC伪造无处可藏
CVPR 2023|哈工大南洋理工提出全球首个「多模态DeepFake检测定位」模型:让AIGC伪造无处可藏
286 0
|
机器学习/深度学习 人工智能 并行计算
清华&天津大学新作 | SurroundOcc: 面向自动驾驶场景的纯视觉 3D 语义占据预测 (已开源)
清华&天津大学新作 | SurroundOcc: 面向自动驾驶场景的纯视觉 3D 语义占据预测 (已开源)
433 0
|
自然语言处理 计算机视觉
华人团队颠覆CV!SEEM完美分割一切爆火,一键分割「瞬息全宇宙」(1)
华人团队颠覆CV!SEEM完美分割一切爆火,一键分割「瞬息全宇宙」
161 0