国科大本科生以第一作者身份发表AAAI论文,用神经网络分析三维模型

简介: 江山代有才人出,此前新智元报道过22岁复旦学生赢得世界深度学习竞赛冠军,日前,中国科学院大学计算机与控制学院首届本科生谈清扬同学,以第一作者身份撰写的论文被 AAAI 2018接受。本科生以一作身份在国际顶会发表论文十分难得。

日前,中国科学院大学计算机与控制学院首届本科生谈清扬同学,以第一作者身份撰写的论文《Mesh-based Autoencoders for Localized Deformation Component Analysis》,被计算机科学领域人工智能顶级会议AAAI录用,并将于2018年2月2日赴美作大会宣讲。

该研究成果是谈清扬同学在中国科学院大学博士生导师、中国科学院计算技术研究所夏时洪研究员领导的人体运动仿真课题组完成的。这是中国科学院大学首批本科生以第一作者身份在顶级国际学术会议发表论文,即便在美国麻省理工学院、普林斯顿大学等国际一流高校本科生中也属相当难得。

2946e269400e4cbafef895dba6b39f6b1c5988b5

谈清扬同学参与了2016年度中国科学院大学生创新实践训练计划项目——基于RGBD相机的人体运动捕获,深入研究了其中的三维模型序列分析,具体由夏时洪研究员和高林副研究员指导完成。

三维模型序列分析在三维模型重建与建模中起到关键的作用,而传统的机器学习方法无法智能地对三维模型库进行合理的分析。该研究工作使用一种新的神经网络结构来对三维网格进行卷积操作,基于课题组前期研究的大尺度形变表示方法,通过在自编码器的网络节点上引入稀疏性约束来得到合理的局部的形变分量,从而可以帮助用户更加精确的编辑模型和根据外部约束进行重建

5c0d68387726e660ae8b100ab0dd1ef335cbed0c

中国科学院大学计算机与控制学院首届本科生谈清扬同学

同时,谈清扬同学还完成了另一篇第一作者论文,“Variational Autoencoders for Deforming 3D Mesh Models“,目前正在审稿中。此前,谈清扬作为国科大首批访学麻省理工学院本科生,共选修4门专业课,成绩均为A,平均绩点达到5.0(麻省理工学院的GPA为5分制)。2014年,谈清扬从江苏南京师范大学附属中学考入国科大。

AAAI是人工智能领域的顶级国际会议(CCF A类会议),每年吸引世界各国数千名学者共同探讨人工智能发展前沿。AAAI 2018将于2月2日-7日在美国新奥尔良(New Orleans, Louisiana, USA)召开。本届会议论文录取率低于25%。

下面简单介绍论文及实验结果。

论文:用基于网格的自编码器进行局部形变组件分析

26f677d0369fd6b41d3430c54181ca686ae9fc2c

摘要

空间局部变形组件对于3D几何处理中的形状分析和合成非常有用。最近研究人员已经提出了好几种方法,旨在提取直观、可解释的变形部件。然而,这些技术存在重大局限(fundamental limitation),特别是对于具有噪声或大规模变形的网格而言,而且这些方法有可能识别不出重要的变形分量。

在本文中,我们提出了一种全新的基于网格的自编码器架构,能够处理具有不规则拓扑的网格。我们在这个框架中引入了稀疏正则化,和卷积运算一起帮助定位变形。我们的框架能够从具有大规模变形的网格数据集中提取局部变形分量,并且对噪声具有鲁棒性。使用提取出的基础,这个框架还提供了一个非线性的方法来重建网格,比当前的线性组合方法更加有效。大量的实验表明,我们的方法在定性和定量评估方面均优于最先进的方法。

974f19853a207545da969f6d9139ad0d56cf139a

上图展示了使用模型生成不可见数据(unseen data)的错误率,使用的数据集是(a) SCAPE(Anguelov et al.2005)和(b) (c) Swing(Vlasic et al.2008)。从上图可见,论文提出的模型(较为深的蓝线)在数据集和指标方面均优于其他方法。

下面这张图展示了使用有限控制点重建SCAPE(Anguelov et al. 2005)和Swing(Vlasic et al. 2008)数据集中不可见数据的泛化误差。同样,较深的蓝色代表论文提出的方法,误差相对其他是最低的。

172860833022a6971c1fc46d51ec9624dbe89556


在下面的对比中,上面一行是通过物理模拟创建的一个旗帜数据集的关键帧。下行是两种方法提取前四个变形分量的结果对比,左边是论文提出的方法。

通过结合这四个组件(权重相同),得出合成结果(下排蓝色的图像),作者展示了使用他们的方法得出的结果更加合理(与上排最右边的结果相比)。

44901532d7adfc9a7c82897085d9893ba7ebef04

原文发布时间为:2017-11-11

本文作者:闻菲

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:国科大本科生以第一作者身份发表AAAI论文,用神经网络分析三维模型

相关文章
|
1月前
|
人工智能 边缘计算 物联网
蜂窝网络未来发展趋势的分析
蜂窝网络未来发展趋势的分析
67 2
|
1月前
|
数据采集 缓存 定位技术
网络延迟对Python爬虫速度的影响分析
网络延迟对Python爬虫速度的影响分析
|
2月前
|
机器学习/深度学习 人工智能
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念对齐人类
【10月更文挑战第18天】这篇论文提出了一种名为AligNet的框架,旨在通过将人类知识注入神经网络来解决其与人类认知的不匹配问题。AligNet通过训练教师模型模仿人类判断,并将人类化的结构和知识转移至预训练的视觉模型中,从而提高模型在多种任务上的泛化能力和稳健性。实验结果表明,人类对齐的模型在相似性任务和出分布情况下表现更佳。
71 3
|
2月前
|
机器学习/深度学习 数据采集 存储
时间序列预测新突破:深入解析循环神经网络(RNN)在金融数据分析中的应用
【10月更文挑战第7天】时间序列预测是数据科学领域的一个重要课题,特别是在金融行业中。准确的时间序列预测能够帮助投资者做出更明智的决策,比如股票价格预测、汇率变动预测等。近年来,随着深度学习技术的发展,尤其是循环神经网络(Recurrent Neural Networks, RNNs)及其变体如长短期记忆网络(LSTM)和门控循环单元(GRU),在处理时间序列数据方面展现出了巨大的潜力。本文将探讨RNN的基本概念,并通过具体的代码示例展示如何使用这些模型来进行金融数据分析。
374 2
|
3天前
|
安全 网络协议 网络安全
网络不稳定导致HTTP代理频繁掉线的分析
随着数字化时代的加速发展,网络安全、隐私保护及内容访问自由成为用户核心需求。HTTP代理服务器因其独特技术优势受到青睐,但其掉线问题频发。本文分析了HTTP代理服务器不稳定导致掉线的主要原因,包括网络问题、服务器质量、用户配置错误及IP资源问题等方面。
19 0
|
28天前
|
安全 网络协议 网络安全
【Azure 环境】从网络包中分析出TLS加密套件信息
An TLS 1.2 connection request was received from a remote client application, but non of the cipher suites supported by the client application are supported by the server. The connection request has failed. 从远程客户端应用程序收到 TLS 1.2 连接请求,但服务器不支持客户端应用程序支持的任何密码套件。连接请求失败。
|
1月前
|
机器学习/深度学习 人工智能 安全
元宇宙中的数字身份:重塑社交网络
在科技飞速发展的今天,元宇宙正从科幻概念变为现实。本文探讨了元宇宙中数字身份的重要性、技术基础及其对社交网络的重塑。数字身份作为连接现实与虚拟世界的桥梁,通过分布式数字身份(DID)、区块链和人工智能等技术,不仅增强了社交互动性,拓展了社交边界,还保障了用户的隐私与安全。未来,数字身份将与元宇宙深度融合,为人类带来更加丰富、多元的数字生活体验。
|
1月前
|
存储 安全 网络安全
网络安全法律框架:全球视角下的合规性分析
网络安全法律框架:全球视角下的合规性分析
46 1
|
2月前
|
机器学习/深度学习 Web App开发 人工智能
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》这篇论文提出了一种基于YOLOv3-Tiny的轻量级目标检测模型Micro-YOLO,通过渐进式通道剪枝和轻量级卷积层,显著减少了参数数量和计算成本,同时保持了较高的检测性能。
43 2
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
|
2月前
|
机器学习/深度学习 编解码 算法
轻量级网络论文精度笔记(三):《Searching for MobileNetV3》
MobileNetV3是谷歌为移动设备优化的神经网络模型,通过神经架构搜索和新设计计算块提升效率和精度。它引入了h-swish激活函数和高效的分割解码器LR-ASPP,实现了移动端分类、检测和分割的最新SOTA成果。大模型在ImageNet分类上比MobileNetV2更准确,延迟降低20%;小模型准确度提升,延迟相当。
75 1
轻量级网络论文精度笔记(三):《Searching for MobileNetV3》
下一篇
DataWorks