《中国人工智能学会通讯》——11.24 本文的出发点:模仿人类视觉

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第11章,第11.24节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

11.24 本文的出发点:模仿人类视觉

表 1 列出了人类视觉系统实现视觉物体分割所依赖的能力及素材,以及计算机与之对应的能力和素材。可以看出二者之间具有很强的可类比性,因此,本文考虑借鉴人类视觉系统的成功经验来指导计算机实现视觉物体的分割。image
由于表1中前三种能力不能直接得到语义级的物体分割,我们将主要关注后面几种能力及其对应的素材。对于人来说,运动感知需要持续一定时间的序列视觉信号,计算机与之对应的能力是光流估计,而所需要的素材为视频。视差感知则需要两只眼睛同时有视觉信号的输入,计算机与之对应的是经过立体校正后的双视图图片,而两个视图对应像素间匹配的过程又称为立体匹配。经过近30 年的研究,目前计算机已经基本具备了运动感知和视差感知能力。

上述两种能力所需要的素材有一个共同的特点,都是多张图片(或多视觉信号)。一般来说,多张图片间的匹配矢量是一种区分不同物体非常有效的特征,可以应用格式塔(Gestalt)心理学中的共同命运准则来实现物体分割。

另一类实现视觉物体分割的素材是通过大量视觉经验的积累而形成的先验知识,包括对物体大小、颜色、纹理、轮廓等特性的总结,被传授的知识等。这些先验知识使得人可以分割单张静止图片中的物体,而不用再完全依赖于多视觉信号。受人类视觉的启发,本文也考虑利用两类途径来使计算机具备分割视觉物体的能力:多视觉信号分析和融合先验知识。具体来说,我们研究了多视觉信号下的匹配和运动建模问题(第 2 和 3 章),研究了各种数据和模型先验下的建模和求解问题(第4 和 5 章)。这些研究对视觉物体分割问题提供了一些新颖的分析方法,也提供了一些有效的算法。

相关文章
|
6月前
|
机器学习/深度学习 并行计算 PyTorch
搭建(人工智能)或(视觉处理)环境前必看
在进行做人工智能或视图处理的一些ai环境搭建的时候,我们经常要下Anaconda要下cuda要下pytorch一大堆的东西,那么这些东西的作用和他们之间的关系是什么呢!
68 1
|
10月前
|
人工智能 自然语言处理 搜索推荐
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat(1)
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat
142 1
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat(1)
|
10月前
|
数据采集 人工智能 计算机视觉
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat(2)
赋予LLM视觉理解能力,360人工智能研究院开源中文多模态对话模型SEEChat
111 0
|
机器学习/深度学习 人工智能 自然语言处理
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
这是ShowMeAI每周通讯的第3期。本期内容关键词:新冠、ChatGPT、2022 AI 报告、腾讯·绝悟、阿里·AliceMind、小红书·全站智投、OpenAI·Point-E、Google·CALM、Wayve·MILE、AI2·MemPrompt、Stanford x MosaicML·PubMed GPT、腾讯全员大会、特斯拉裁员、图森未来裁员、AI 应用与工具大全。
478 0
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
|
机器学习/深度学习 人工智能 自动驾驶
AI如何能比人类的眼睛看得更清楚?通俗的解释卷积神经网络
AI如何能比人类的眼睛看得更清楚?通俗的解释卷积神经网络
117 0
AI如何能比人类的眼睛看得更清楚?通俗的解释卷积神经网络
|
机器学习/深度学习 人工智能 算法
可以学习人类语言模式的人工智能
一种新的人工智能自动学习模型可以应用于不同语言的高级语言模式,使其能够取得更好的结果。
111 0
可以学习人类语言模式的人工智能
|
人工智能 算法 芯片
人工智能无法取代人类工作的六个原因
虽然人工智能被设计成一种更有效、更快速的工作方式来取代手工劳动,但它无法取代工作空间中对人工输入的需求。
371 0
人工智能无法取代人类工作的六个原因
|
机器学习/深度学习 人工智能 算法
AI到来,可能会给人类社会带来的影响
人类该如何应对AI时代,目前对AI大多是预测,其可能会带来的影响。
AI到来,可能会给人类社会带来的影响
|
机器学习/深度学习 数据采集 人工智能
借助AI 人类能听懂动物的“喜怒哀乐”?
人工智能是否可以实现人与动物的沟通?算法具体是如何分辨动物情绪的?目前,人类要通过AI理解动物语言,还需克服哪些困难?
借助AI 人类能听懂动物的“喜怒哀乐”?
|
机器学习/深度学习 存储 传感器
图灵奖获得者 Yann LeCun :学习“世界模型”的能力是构建人类级 AI 的关键所在
本文最初发布于 Meta AI 博客,由 InfoQ 中文站翻译并分享。
202 0
图灵奖获得者 Yann LeCun :学习“世界模型”的能力是构建人类级 AI 的关键所在

热门文章

最新文章