中国人工智能学会通讯——深度学习与视觉计算 1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

简介:

1.3 计算机视觉领域利用深度学习可能带来的未来研究方向

image

第一个,深度图像分析。目前基于深度 学习的图像算法在实验数据库上效果还是 不错的,但是远远不能够满足实际大规模 应用需求,需要进一步的提升算法性能从 而能够转化相应的实际应用。比如这个基 于图片的应用,可以估计性别和年龄,但 是其实经常会犯错,因此需要进一步提升 深度图像分析的性能。

image

第二个,深度视频分析。视频分析牵扯 到大量的数据和计算量,所以做起来更加 麻烦。当前深度视频分析还处于起步的阶 段,然而视频应用非常广泛,比如人机交互、 智能监控等,所以加强深度视频分析是个 重要的方向。

image

第三个,大规模深度学习。随着时间的 推移,数据量将呈指数级增长。为了处理 更大规模的数据,需要进行多 GPU 并行及 分布式计算。开发大规模深度学习算法是 相当必要的。

image

第四个,无监督(半监督)学习。这 个方向是很明显的,因为实际应用中监 督信息可能常常是缺失的,在大数据时 代背景下要想标注所有的数据代价也是 昂贵的。为了充分应用无标记的数据, 进行无监督(或半监督)学习是非常重 要的。近来的预测学习本质上与无监督 学习是对应的。

image

第五个,多模态学习。多模态数据无 处不在,尤其在互联网时代,网络上的图 像、文本、语音等同时存在。多模态数据 具有语义一致性、信息互补性的特点,互 补性可做多模态数据的融合,一致性可做 跨模态关联(如跨模态检索)。视觉信息 的有效理解离不开周边文本等其他模态数 据,因此多模态学习是非常有意义的研究 方向。

image

第六个,类脑智能研究。神经网络本 身是模拟大脑认知机理提出的网络结构。 当前部分生物机制已经被应用到深度学习 中,比如注意机制、神经元跨层连接机制等。 我们有幸申请到一个基金委重点项目,探 索深度认知神经网络模型与方法,就是希 望在神经网络模型上能够嵌入一些脑认知 功能,比如注意机制、记忆机制、反馈机制、 推理机制等,以期开发更 Powerful 的神经 网络新模型。在全球推动脑计划的大背景 下,研究类脑智能显得尤为迫切和必要。

(本文根据王亮研究员在中国人工智能学会首 期“人工智能前沿讲习班”的现场报告整理)

image

博士,研究员,博士生导师,IEEE 高级会员,国际模式识别协会会士(IAPR Fellow),模式识别国家重点 实验室副主任,计算机学会计算机视觉专委会秘书长,图像视频大数据产业技术创新战略联盟秘书长,电子 学会青年科学家俱乐部副主席,中国图象图形学学会视觉大数据专委主任,中国科学院脑科学与智能技术卓 越中心骨干。中科院百人计划入选者(终期优秀),国家杰出青年科学基金获得者,国家青年科技奖获得者。 2004 年获中科院自动化所工学博士学位。2004-2010 年分别在英国帝国理工学院、澳大利亚莫纳什大学、 墨尔本大学及英国巴斯大学工作。主要研究领域是模式识别、计算机视觉、大数据分析等。目前 Google Scholar 引用 9 200 余次,近 5 年 SCI 他引 1200 次。

相关文章
|
15天前
|
机器学习/深度学习 人工智能 安全
探索AI的未来:从机器学习到深度学习
【10月更文挑战第28天】本文将带你走进AI的世界,从机器学习的基本概念到深度学习的复杂应用,我们将一起探索AI的未来。你将了解到AI如何改变我们的生活,以及它在未来可能带来的影响。无论你是AI专家还是初学者,这篇文章都将为你提供新的视角和思考。让我们一起探索AI的奥秘,看看它将如何塑造我们的未来。
52 3
|
18天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
74 9
|
11天前
|
机器学习/深度学习 人工智能 人机交互
图形学领域的研究热点会给人工智能带来哪些挑战和机遇?
图形学中的一些研究热点,如 3D 模型生成与重建,需要大量的 3D 数据来训练模型,但 3D 数据的获取往往比 2D 图像数据更困难、成本更高。而且,3D 数据的多样性和复杂性也使得数据的标注和预处理工作更加繁琐,这对人工智能的数据处理能力提出了更高要求。例如,在训练一个能够生成高精度 3D 人体模型的人工智能模型时,需要大量不同姿态、不同体型的 3D 人体扫描数据,而这些数据的采集和整理是一项艰巨的任务.
|
26天前
|
机器学习/深度学习 调度 计算机视觉
深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究
本文探讨了多种学习率调度策略在神经网络训练中的应用,强调了选择合适学习率的重要性。文章介绍了阶梯式衰减、余弦退火、循环学习率等策略,并分析了它们在不同实验设置下的表现。研究表明,循环学习率和SGDR等策略在提高模型性能和加快训练速度方面表现出色,而REX调度则在不同预算条件下表现稳定。这些策略为深度学习实践者提供了实用的指导。
33 2
深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究
|
9天前
|
机器学习/深度学习 人工智能 机器人
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
|
11天前
|
机器学习/深度学习 人工智能 数据可视化
人工智能在图形学领域的研究热点有哪些?
AIGC:通过生成对抗网络(GAN)、变分自编码器(VAE)及其变体等技术,能够根据用户输入的文字描述、草图等生成高质量、高分辨率的图像,在艺术创作、游戏开发、广告设计等领域应用广泛。如OpenAI的DALL-E、Stable Diffusion等模型,可生成风格各异、内容丰富的图像,为创作者提供灵感和素材.
|
17天前
|
机器学习/深度学习 算法 编译器
Python程序到计算图一键转化,详解清华开源深度学习编译器MagPy
【10月更文挑战第26天】MagPy是一款由清华大学研发的开源深度学习编译器,可将Python程序一键转化为计算图,简化模型构建和优化过程。它支持多种深度学习框架,具备自动化、灵活性、优化性能好和易于扩展等特点,适用于模型构建、迁移、部署及教学研究。尽管MagPy具有诸多优势,但在算子支持、优化策略等方面仍面临挑战。
44 3
|
17天前
|
机器学习/深度学习 人工智能 算法
AI在医疗:深度学习在医学影像诊断中的最新进展
【10月更文挑战第27天】本文探讨了深度学习技术在医学影像诊断中的最新进展,特别是在卷积神经网络(CNN)的应用。文章介绍了深度学习在识别肿瘤、病变等方面的优势,并提供了一个简单的Python代码示例,展示如何准备医学影像数据集。同时强调了数据隐私和伦理的重要性,展望了AI在医疗领域的未来前景。
39 2
|
21天前
|
机器学习/深度学习 人工智能 算法
深度学习在计算机视觉中的突破与未来趋势###
【10月更文挑战第21天】 近年来,深度学习技术极大地推动了计算机视觉领域的发展。本文将探讨深度学习在图像识别、目标检测和图像生成等方面的最新进展,分析其背后的关键技术和算法,并展望未来的发展趋势和应用前景。通过这些探讨,希望能够为相关领域的研究者和从业者提供有价值的参考。 ###
39 4
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-19
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-19
46 2