巩固图像和物体识别领域领导地位:谷歌出新招

本文涉及的产品
图像搜索,7款服务类型 1个月
简介:

Google里有远见的领导者已经向其计算机里注入了他们的愿景。

为了支撑其已经引人瞩目的图像和物体识别领域的领导地位,搜索巨头并购了法国创业公司Moodstocks,该公司擅长于智能手机里的基于机器学习的图像识别技术。

“我们的梦想是将摄像头调优成智能传感器来赋予机器眼睛,让它们能够感知周围的环境,” Moodstocks在其声明中这么说。

Google收购Moodstocks是其“人才并购”中的最新手笔,这样的并购涉及基于机器学习的图像识别,这是计算机视觉领域的核心组件。Amazon在今年初收购Orbeus、Twitter几周前收购了Magic Pony Technology,这起收购发生在这之后,这反映出了业界观察家们所描述的科技领导者间的竞争,他们都在尝试加速商业化下一个计算机相关的前沿领域。

“科技公司已经投资了大量时间和金钱来理解互联网文本,”Forrester Research的首席分析师Mike Gualtieri在一封邮件里写到。“他们现在想要理解图像,这十分自然。通过文字和图像的组合意思所能够提供出的AI,不仅仅能够理解文字(语音),而且能够进行图像识别。”

比如,Google已经传闻在开发能够让用户仅仅用图像作为搜索词,直接从照片里进行搜索的功能。Google希望能够利用Moodstocks的人才力量——他们将会加入Google位于巴黎的现有的研究和开发团队,来帮助进一步推进计算视觉领域的研究。

“我们已经在视觉识别方面有了很大的成功,” Vincent Simonet写到,他是Google法国研究和开发中心的老大,“但是该领域还有很多事情需要完成。”

大数据引领图像识别的新纪元

Google Photos——以及Facebook,Flickr和其他处理图像分类和标记的公司,已经在后台采用了先进的图像识别技术,但是“这些方案还能够更快,更高效,并且要求更少的训练资源,” Tomasz Malisiewicz博士也同意这一点,他是Magic Leap Inc.深度学习领域的首席软件工程师,这是一家位于佛罗里达州的致力于增强现实技术的创业公司。

“在图像识别的全新的深度学习时代里,计算视觉团队的整个概念都在被重构,” Malisiewicz说。“当算法开发还依靠人工的时候,拥有强大的博士团队来引导开发是十分重要的。但是随着深度学习软件的商业化,大部分开发人员都能够使用今年最流行的神经网络架构来训练识别模型。”

这个新时代的图像识别领域里至关重要的就是数据——大量数据。

“关注点已经从算法设计本身转移到大规模数据管理上,因为性能最好的模型要求海量的数据,” Malisiewicz说。

重构视觉世界

对于公司而言,除了海量数据之外,这里面还有些什么?分析师指出,基于机器学习的图像识别用例不仅仅是简单的分类,比如找到个人家庭照片或者在购物分类里缩小产品类型。

该技术拥有变革医疗行业的可能性,比如,通过医疗图像帮助医生诊断疾病。另外,增强和虚拟现实的可穿戴设备需要使用摄像头来感知周围的世界,能够受益于图像识别和改进的跟踪功能,Malisiewicz说。

基于机器学习的图像识别能够帮助企业自动化运维功能,比如监控,实地检测以及其他任何涉及持续或者周期性检查的事情,Forrester的Gualtieri说。

计算视觉领域的进步所带来的可操作数据开启了企业盈利的新机遇,Matthew Zeiler这么认为,他是Clarifai的创始人和CEO,这是一家擅长于视觉识别的AI公司。

“他们还能够从之前未标记的信息源里收集信息,这些信息源是没有任何描述,元数据或者标签的图像和视频,”他补充道。

还会带来一些其他的好处。计算视觉仍然是相对新的领域,积极探索很重要,密歇根大学电子工程和计算机科学的副教授Jason Corso博士说。

“很重要的一点是,要注意到这些进步和商业案例很少涉及可能的市场和问题。我们的世界是视觉世界;对于未来的先进技术而言,利用这个世界的丰富性是非常重要的,”他说。





====================================分割线================================


本文转自d1net(转载)

目录
相关文章
|
3月前
|
人工智能 安全 算法
5年数据观巨变,这家公司如何在AI和大模型数据赛道遥遥领先?
5年数据观巨变,这家公司如何在AI和大模型数据赛道遥遥领先?
116 12
|
存储 人工智能 自然语言处理
【ChatGPT】多国“围堵”,万人抵制,AI发展的红线到底在哪?
【ChatGPT】多国“围堵”,万人抵制,AI发展的红线到底在哪?
178 0
|
机器学习/深度学习 数据可视化 数据挖掘
CVPR 2023|哈工大南洋理工提出全球首个「多模态DeepFake检测定位」模型:让AIGC伪造无处可藏
CVPR 2023|哈工大南洋理工提出全球首个「多模态DeepFake检测定位」模型:让AIGC伪造无处可藏
260 0
|
传感器 人工智能 自然语言处理
亚马逊Alexa科学家:图灵测试70年已成古董,要给AI构建新的「黄金标准」了!
【新智元导读】1950 年,图灵提出著名的「图灵测试」去回答「机器能否思考」的问题,目的是判断机器是否能表现出人类也无法区分的对话行为。70年来,图灵测试也一直作为学术界的AI「北极星」而存在。近日,亚马逊语音助手 Alexa 部门的首席科学家认为,人们现在关心的是人机之间的互动,而不是区分机器和人类。他认为,图灵测试过时了,AI 需要新基准测试!
303 0
亚马逊Alexa科学家:图灵测试70年已成古董,要给AI构建新的「黄金标准」了!
|
安全 数据挖掘 数据安全/隐私保护
挑战巨头,主打安全的Telegram、超信胜算几何?
病毒是不断进化的,再缜密的安全防护也不可能面面俱到,尽管消费者从WhatsApp转投Telegram让我们看到了后来者的希望,但显然还有些事待完成。
228 0
挑战巨头,主打安全的Telegram、超信胜算几何?
|
算法 机器人 开发工具
机器人真·涨姿势了:比肩人类抓取能力,上海交大、非夕科技联合提出全新方法AnyGrasp
在近日召开的 ICRA (国际机器人与自动化会议)大会上,上海交大-非夕科技联合实验室展示了最新研究成果「AnyGrasp」(https://graspnet.net/anygrasp.html),第一次实现机器人对于任意场景的任意物体的通用高速抓取,在机械臂硬件构型、相机不作限制的情况下,让机器人拥有比肩人类抓取能力的可能。
810 0
机器人真·涨姿势了:比肩人类抓取能力,上海交大、非夕科技联合提出全新方法AnyGrasp
|
机器学习/深度学习 人工智能 达摩院
从憧憬中来,到革新里去,记录科技改变世界的魔幻之年 | 趋势预测
从憧憬中来,到革新里去,记录科技改变世界的魔幻之年 | 趋势预测
151 0
从憧憬中来,到革新里去,记录科技改变世界的魔幻之年 | 趋势预测
|
人工智能 机器人 定位技术
为移动应用加上眼睛,谷歌收购法国图像识别创业公司 Moodstocks
毫无疑问,人工智能是当前科技行业最热门的概念,没有之一。为了保证自己在这「下一个万亿美元级」市场的优势,科技巨头们不会放过任何可能对自己有利的技术和人才。
165 0
为移动应用加上眼睛,谷歌收购法国图像识别创业公司 Moodstocks
|
人工智能 自然语言处理 语音技术
出门问问获得谷歌战略投资,打造人工智能软件、硬件和服务的深度融合
国内人工智能创业公司出门问问宣布完成C轮融资,由谷歌投资,本轮融资后,出门问问估值3亿美金。截至本轮融资,出门问问自成立之日起已经获得了7500万美元的融资。
251 0
|
机器学习/深度学习 人工智能 编解码
产品视频被曝合成,用GAN造出4个工程师,10天众筹3万美元,这家初创公司火了
产品视频被曝合成,用GAN造出4个工程师,10天众筹3万美元,这家初创公司火了
164 0