一周AI最火论文 | 和机器人一起“云”健身,VR健身房助力人机交互

简介: 一周AI最火论文 | 和机器人一起“云”健身,VR健身房助力人机交互

本周关键词:AutoML、强化学习、VR

本周最佳学术研究

用AutoML-Zero从零开始发展的机器学习算法

在最近的一篇论文中,为了鼓励更多AutoML的研究,Google AI展示了从头成功开发ML算法的可能性。

以前,AutoML的作用是,通过神经体系结构搜索(NAS)技术,对不同需求自动生成并设计出相应的机器学习算法。

想使用NAS,需要专家来构建复杂的设计层来帮助构建神经网络。但是,在研究员称为AutoML-Zero的这种新方法中,Google AI展示了一种替代方法,可以自动发现以基本数学运算为基础的完整ML算法。

在小图像的分类问题上,该新方法重新发现了基本的机器学习技术,例如带有反向传播的2层神经网络,线性回归等。所获得的结果证明了,使用算法自动发现机器学习算法是可行的,这对解决未来的难题可能很有借鉴意义。

原文:
https://ai.googleblog.com/2020/07/automl-zero-evolving-code-that-learns.html

深层次变分自编码器

在本文中,NVIDIA研究人员提出了一种称为Nouveau VAE的深度变分自动编码器(VAE),该编码器使用深度方向可分离的卷积以及批归一化,来生成大型高质量图像。

NVAE的设计着眼于解决两个主要挑战,首先是设计针对VAE的具有强表现力的神经网络,第二则是在保持训练稳定性的同时,扩展训练到更多层,让它适合更多不同的图像尺寸。

这项工作表明,NVAE在MNIST,CIFAR-10和CelebA HQ数据集中基于非自回归似然性的模型中,得到了最优的结果。NVAE也为FFHQ提供了强有力的基准线。例如,在CIFAR-10上,NVAE将最新技术从每维2.98位提高到了2.91位,并在CelebA HQ上生成了高质量图像。据研究人员称,NVAE是第一个成功应用于大尺寸256×256像素自然图像的VAE。

原文:
https://arxiv.org/abs/2007.03898

有限资源深度学习的中高效的数据和计算设计

深度学习最近已越来越靠近边缘设备,这为创造需要实时分析数据的新应用程序,提供了可能。但是,深度神经网络的计算量很大,需要大量的数据进行训练以及复杂的体系结构,才能实现最新的性能。

本文中,为了实现更好的泛化和更高效的推理,研究人员试图通过结合量化和等方差的方式来解决此问题。他们设计并测试了MobileNetV2的等变版本,并通过模型量化对其进行了进一步优化,实现了更高效的推理。结果显示,这个设计对Patch Camelyon(PCam)医疗数据集具有最先进的性能,同时计算效率更高。

原文:
https://arxiv.org/abs/2004.09691v2

Duality — 强化学习新方法

谷歌AI研究人员开发了一种用于强化学习(RL)的新方法,可以实现既实用又符合数学原理的算法。这意味着所得到的算法可避免使用非常粗略的近似来实现其数学基础原理。

基于凸对偶性所得到的方法是一种经过充分研究的数学工具,用于将以一种形式表示的问题转换为其他形式的等效问题,从而可能更利于计算。谷歌AI研究人员所开发的在强化学习(RL)中应用对偶性的特定方法,将传统的约束满足式数学问题转换为无约束且更实际的数学问题。

他们希望强化学习和(凸)优化之间的联系可以促进这两个领域研究人员之间的进一步合作。

原文:
https://ai.googleblog.com/2020/07/duality-new-approach-to-reinforcement.html

利用真人互动改进虚拟辅助机器人

在这个项目中,研究人员提出了辅助虚拟现实健身房(AVR Gym),这是一个开源框架,用于真人与虚拟辅助机器人的交互。

研究人员认为,多功能的机器人护工可以使全球数百万人(包括老年人和残疾人)受益。

由于对如何使机器人护工通过物理模拟学习与人互动的研究仍然是一个巨大的挑战,因此他们提出的方法可能还需要很长时间才能实现。

研究人员提供的证据表明,AVR Gym可以帮助他们提高受过模拟训练的辅助机器人的性能。其成果显示,VR可以通过让真人与虚拟机器人进行交互,帮助缩小物理模拟与现实之间的差距,从而为实现真正的机器人辅助铺平道路。

原文:
https://arxiv.org/abs/2007.04959v1

其他爆款论文

人脸3D重建新方法 - 用单色图像即可生成高质量的重建图像,且可以适应自遮挡和大范围姿势变形:
https://arxiv.org/abs/2007.03979v1

基于神经架构搜索的新型目标检测架构:
https://ai.googleblog.com/2020/06/spinenet-novel-architecture-for-object.html

利用图卷积神经网络优势,打造一种有效的基于图表的视触觉融合式3D重建方法:
https://arxiv.org/abs/2007.03778v1

Pix2Vox++:一种在准确性和效率上均优于传统方法的新型3D对象重建方法:
https://arxiv.org/abs/2006.12250v2

改进GAN实现语音增强:
https://arxiv.org/abs/2001.05532v2

资源

一个涵盖机器学习论文及代码实现的免费分享社区:
https://paperswithcode.com/methods

Pytorch官方教程免费书籍下载:
https://pytorch.org/deep-learning-with-pytorch

Gradio:仅需几行代码,即可为机器学习模型甚至Python函数生成易用的web界面:
https://gradio.app/

AI大事件

福布斯AI 50排行榜多家公司创始人预测后新冠疫情时代的AI发展空间:
https://www.forbes.com/sites/kenrickcai/2020/07/10/ai-50-founders-post-coronavirus-predictions/#17c8ce6d2ccc

亚马逊官宣将在未来几个月内开始使用无人机运送包裹:
https://www.zdnet.com/article/amazon-unveils-drone-that-will-be-delivering-packages-in-months/

大众创新为AI肺癌筛查提速:
https://www.zdnet.com/article/researchers-find-crowdsourcing-ai-go-together-in-battle-vs-lung-cancer/

相关文章
|
5月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
991 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
6月前
|
人工智能 JSON 前端开发
Agentic AI崛起:九大核心技术定义未来人机交互模式​
本文系统梳理AI智能体架构设计的九大核心技术,涵盖智能体基础、多智能体协作、知识增强、模型优化、工具调用、协议标准化及人机交互等关键领域,助力构建高效、智能、协同的AI应用体系。建议点赞收藏,持续关注AI架构前沿技术。
1693 1
|
5月前
|
机器学习/深度学习 人工智能 人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
503 121
|
5月前
|
人工智能 搜索推荐 数据可视化
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
当AI学会“使用工具”:智能体(Agent)如何重塑人机交互
637 115
|
5月前
|
人工智能 安全 搜索推荐
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
513 117
|
11月前
|
人工智能 算法 数据可视化
机器人训练师狂喜!Infinite Mobility:上海AI Lab造物神器1秒生成可动家具,成本只要1分钱
上海AI Lab推出的Infinite Mobility采用程序化生成技术,可高效生成22类高质量可交互物体,单个生成仅需1秒且成本低至0.01元,已应用于机器人仿真训练等领域。
683 2
机器人训练师狂喜!Infinite Mobility:上海AI Lab造物神器1秒生成可动家具,成本只要1分钱
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。
1470 1
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
|
6月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
436 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
5月前
|
人工智能 自然语言处理 供应链
超越聊天:AI代理——下一代人机交互的雏形
超越聊天:AI代理——下一代人机交互的雏形
400 22
|
6月前
|
人工智能 机器人 Serverless
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
当云计算遇见具身智能,AI咖啡开启零售新体验。用户通过手机生成个性化图像,云端AI快速渲染,机器人精准复刻于咖啡奶泡之上,90秒内完成一杯可饮用的艺术品。该方案融合阿里云FunctionAI生图能力与安诺机器人高精度执行系统,实现AIGC创意到实体呈现的闭环,为线下零售提供低成本、高互动、易部署的智能化升级路径,已在商场、机场、展馆等场景落地应用。
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案