计算机图形学遇上深度学习

简介: 今日,TensorFlow 宣布推出 TensorFlow Graphics,该工具结合计算机图形系统和计算机视觉系统,可利用大量无标注数据,解决复杂 3D 视觉任务的数据标注难题,助力自监督训练。

来源商业新知网,原标题:计算机图形学遇上深度学习:针对3D图像的TensorFlow Graphics面世

今日,TensorFlow 宣布推出 TensorFlow Graphics,该工具结合计算机图形系统和计算机视觉系统,可利用大量无标注数据,解决复杂 3D 视觉任务的数据标注难题,助力自监督训练。

GitHub 地址:https://github.com/tensorflow/graphics
近几年,一种可以插入神经网络架构中的新型可微图形层(differentiable graphics layer)开始兴起。从空间变换器(spatial transformer)到可微图形渲染器,这些新型网络层利用多年的和图形学研究知识来构建更高效的新网络架构。将几何先验和约束显式建模到神经网络中,为能够以自监督的方式进行稳健、高效训练的架构打开了大门。

从高级层面来说,计算机图形管道需要 3D 物体及其在场景中的绝对位置、材质描述、光和摄像头。然后,渲染器利用该场景描述生成合成渲染。

1_jpeg

相比之下,计算机视觉系统从图像开始,推理场景的参数,对场景中的物体及其材质、三维位置和方向进行预测。

2_jpeg

训练能够解决这些复杂 3D 视觉任务的机器学习系统通常需要大量数据。由于标注数据的过程既昂贵又复杂,因此设计能够理解三维世界且训练时无需太多监督的机器学习模型非常重要。

结合计算机视觉和计算机图形学技术后,我们得以利用大量可用的无标注数据。如下图所示,这可以通过合成分析(analysis by synthesis)来实现:视觉系统抽取场景参数,图形系统基于这些参数渲染图像。

如果渲染图像结果与原始图像匹配,则说明视觉系统准确地抽取了场景参数。在该设置中,计算机视觉和计算机图形学携手合作,形成了一个类似自编码器的机器学习系统,该系统能够以自监督的方式进行训练。

3_jpeg

可微图形层

接下来,我们将探索 TensorFlow Graphics 的一些可用功能。更多详情,参见 GitHub 项目。

变换

物体变换控制物体在空间中的位置。如下图所示,利用轴角度旋转立方体。旋转轴指向上方,旋转方向为逆时针,使得立方体逆时针旋转。以下 示例展示了如何在神经网络中训练旋转形式,该神经网络被训练用于预测观测物体的旋转和平移。

地址 https://colab.sandbox.google.com/github/tensorflow/graphics/blob/master/tensorflow_graphics/notebooks/6dof_alignment.ipynb
这项任务是很多应用的核心,包括聚焦于与其环境进行交互的机器人。在这些场景中,用机械臂抓取物体需要精确估计这些物体相对于机械臂的位置。

4

建模摄像头

摄像头模型在计算机视觉领域中非常重要且基础,因为它们对三维物体投影到图像平面上的外观有极大影响。如下图所示,该立方体看起来可以放大和缩小,但是事实上这些变化仅仅是由于焦距产生的变化。

想了解摄像头模型的详情,以及如何在 中使用它们的具体示例,可以查看:

https://colab.sandbox.google.com/github/tensorflow/graphics/blob/master/tensorflow_graphics/notebooks/intrinsics_optimization.ipynb
材质

材质模型(material model)定义光与物体的交互过程,从而提供物体的外观。例如,一些材质(如石膏)在各个方向对光进行反射,而镜面等材质会对光进行镜面反射。

在以下交互式 Colab notebook 中,你可以了解如何使用 Tensorflow Graphics 生成如下渲染。你还可以试验不同的材质和光的参数,更充分地了解其交互过程。

地址:https://colab.sandbox.google.com/github/tensorflow/graphics/blob/master/tensorflow_graphics/notebooks/reflectance.ipynb
准确地预测材质属性是很多任务的基础。例如,它可以让用户在自己的环境中放置虚拟家具,室内环境搭配家具的场景非常逼真,从而让用户准确地感知到这件家具的外观。

5_jpeg

几何——3D 卷积和池化

近年来,以点云或网格形式输出三维数据的传感器逐渐成为我们日常生活的一部分,包括智能手机深度传感器、自动驾驶汽车雷达等等。由于其结构不规则,在这些表征上执行卷积要比在规则网格结构上困难得多。

TensorFlow Graphics 提供两个 3D 卷积层和一个 3D 层,允许网络在网格上执行语义部分分类(如下图所示),更多信息参见该 Colab notebook:

https://colab.sandbox.google.com/github/tensorflow/graphics/blob/master/tensorflow_graphics/notebooks/mesh_segmentation_demo.ipynb

6_jpeg

TensorBoard 3d

视觉 debug 是评估实验是否按正确方向运行的重要方式。因此,TensorFlow Graphics 配备有 TensorBoard 插件,以便交互式地查看 3d 网格和点云。

7

开始项目

TensorFlow Graphics 与 TensorFlow 1.13.1 及以上版本兼容。

相关文章
|
7月前
|
机器学习/深度学习 自然语言处理 算法
深度学习算法:从模仿到创造
深度学习是一种受到生物学启发的机器学习方法,其目标是通过构建多层神经网络来模拟人脑的工作原理。它在过去几十年来取得了巨大的进展,并在图像识别、语音识别、自然语言处理等领域取得了突破性的成果。 深度学习的核心思想是模仿人脑的神经网络。人脑中的神经元通过连接起来形成庞大的神经网络,用来处理感知、思维和决策等任务。深度学习的神经网络也是由许多层次的神经元组成,每一层都能够从上一层中学习到更加抽象的特征表示。通过训练数据,深度学习模型能够自动学习到最优的特征表示,并用于解决各种复杂的任务。
|
4月前
|
机器学习/深度学习 自然语言处理 数据安全/隐私保护
深度学习中的艺术与科学:探索神经网络的奥秘
本文将带您走进深度学习的奇妙世界,一探神经网络背后的科学原理和艺术创造。我们将从基础概念出发,逐步深入到模型训练的技巧,以及如何应对过拟合等常见问题。通过实例分析,我们将展示深度学习技术在图像识别和自然语言处理等领域的应用,并讨论其在未来科技发展中的潜在影响。让我们一同解锁深度学习的力量,发现它如何塑造我们的数字世界。
|
26天前
|
机器学习/深度学习 人工智能 监控
深度学习与图像识别的奇妙之旅
【10月更文挑战第42天】在这篇文章中,我们将一同探索深度学习如何革新了我们对图像的理解。通过深入浅出的方式,我们将了解深度学习模型如何学会“看”世界,并实现令人惊叹的图像识别能力。文章将带领读者从基础概念出发,逐步深入到模型训练和优化策略,最后以实际的代码示例来揭示这一技术的强大之处。无论你是深度学习领域的新手,还是希望加深理解的资深爱好者,这篇文章都将为你提供宝贵的知识与启示。
30 1
|
4月前
|
机器学习/深度学习 自然语言处理 自动驾驶
深度学习的奥秘:探索神经网络背后的科学
【8月更文挑战第26天】 在本文中,我们将一起揭开深度学习神秘的面纱,深入理解神经网络如何模仿人脑处理信息。通过浅显易懂的语言和生动的比喻,本文将带你从基础概念出发,逐步深入了解深度学习的核心机制和应用实例,让你对这一前沿技术有一个全面而深刻的认识。
182 62
|
4月前
|
机器学习/深度学习
深度学习中的艺术与科学:探索神经网络之美
【8月更文挑战第28天】 在这篇文章中,我们将一起潜入深度学习的海洋,探索那些隐藏在数据波涛之下的秘密。从初学者的迷茫到技术高手的自信,每一步都像是在画布上添加新的颜色。我们会看到,就像甘地所说:“你必须成为你希望在世界上看到的改变。”通过学习和实践,我们能够解锁知识的宝藏,让复杂的理论变得简单易懂。让我们一起跟随数据的指引,发现深度学习的力量和美。
56 7
|
4月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现深度学习模型:智能文化遗产保护与传承
【8月更文挑战第10天】 使用Python实现深度学习模型:智能文化遗产保护与传承
66 6
|
机器学习/深度学习 数据采集 人工智能
基于深度学习设计AI麻将程序
基于深度学习设计AI麻将程序
1781 0
基于深度学习设计AI麻将程序
|
机器学习/深度学习 人工智能 数据可视化
【人工智能】神经网络八股
【人工智能】神经网络八股
189 0
【人工智能】神经网络八股
|
机器学习/深度学习 PyTorch 算法框架/工具
2019 到目前为止的深度学习研究进展汇总
在刚刚结束的2019年的第一季度里,深度学习技术在快速的向前发展。
1349 0
|
机器学习/深度学习 人工智能
LeCun最新演讲:深度学习大革命来了,可微分编程潜力巨大
今天上午举行的GMIC大会上,Facebook首席AI科学家Yann LeCun进行了主题演讲。他介绍了当前AI的一些最新进展,FAIR在计算机视觉领域提出的一些最先进的架构。他提到,未来还会出现更多的有关深度学习的变革,比如说更复杂的架构,同时也会出现更多的新理论。
1532 0