一周AI最火论文 | 和机器人一起“云”健身,VR健身房助力人机交互

简介: 一周AI最火论文 | 和机器人一起“云”健身,VR健身房助力人机交互

本周关键词:AutoML、强化学习、VR

本周最佳学术研究

用AutoML-Zero从零开始发展的机器学习算法

在最近的一篇论文中,为了鼓励更多AutoML的研究,Google AI展示了从头成功开发ML算法的可能性。

以前,AutoML的作用是,通过神经体系结构搜索(NAS)技术,对不同需求自动生成并设计出相应的机器学习算法。

想使用NAS,需要专家来构建复杂的设计层来帮助构建神经网络。但是,在研究员称为AutoML-Zero的这种新方法中,Google AI展示了一种替代方法,可以自动发现以基本数学运算为基础的完整ML算法。

在小图像的分类问题上,该新方法重新发现了基本的机器学习技术,例如带有反向传播的2层神经网络,线性回归等。所获得的结果证明了,使用算法自动发现机器学习算法是可行的,这对解决未来的难题可能很有借鉴意义。

原文:
https://ai.googleblog.com/2020/07/automl-zero-evolving-code-that-learns.html

深层次变分自编码器

在本文中,NVIDIA研究人员提出了一种称为Nouveau VAE的深度变分自动编码器(VAE),该编码器使用深度方向可分离的卷积以及批归一化,来生成大型高质量图像。

NVAE的设计着眼于解决两个主要挑战,首先是设计针对VAE的具有强表现力的神经网络,第二则是在保持训练稳定性的同时,扩展训练到更多层,让它适合更多不同的图像尺寸。

这项工作表明,NVAE在MNIST,CIFAR-10和CelebA HQ数据集中基于非自回归似然性的模型中,得到了最优的结果。NVAE也为FFHQ提供了强有力的基准线。例如,在CIFAR-10上,NVAE将最新技术从每维2.98位提高到了2.91位,并在CelebA HQ上生成了高质量图像。据研究人员称,NVAE是第一个成功应用于大尺寸256×256像素自然图像的VAE。

原文:
https://arxiv.org/abs/2007.03898

有限资源深度学习的中高效的数据和计算设计

深度学习最近已越来越靠近边缘设备,这为创造需要实时分析数据的新应用程序,提供了可能。但是,深度神经网络的计算量很大,需要大量的数据进行训练以及复杂的体系结构,才能实现最新的性能。

本文中,为了实现更好的泛化和更高效的推理,研究人员试图通过结合量化和等方差的方式来解决此问题。他们设计并测试了MobileNetV2的等变版本,并通过模型量化对其进行了进一步优化,实现了更高效的推理。结果显示,这个设计对Patch Camelyon(PCam)医疗数据集具有最先进的性能,同时计算效率更高。

原文:
https://arxiv.org/abs/2004.09691v2

Duality — 强化学习新方法

谷歌AI研究人员开发了一种用于强化学习(RL)的新方法,可以实现既实用又符合数学原理的算法。这意味着所得到的算法可避免使用非常粗略的近似来实现其数学基础原理。

基于凸对偶性所得到的方法是一种经过充分研究的数学工具,用于将以一种形式表示的问题转换为其他形式的等效问题,从而可能更利于计算。谷歌AI研究人员所开发的在强化学习(RL)中应用对偶性的特定方法,将传统的约束满足式数学问题转换为无约束且更实际的数学问题。

他们希望强化学习和(凸)优化之间的联系可以促进这两个领域研究人员之间的进一步合作。

原文:
https://ai.googleblog.com/2020/07/duality-new-approach-to-reinforcement.html

利用真人互动改进虚拟辅助机器人

在这个项目中,研究人员提出了辅助虚拟现实健身房(AVR Gym),这是一个开源框架,用于真人与虚拟辅助机器人的交互。

研究人员认为,多功能的机器人护工可以使全球数百万人(包括老年人和残疾人)受益。

由于对如何使机器人护工通过物理模拟学习与人互动的研究仍然是一个巨大的挑战,因此他们提出的方法可能还需要很长时间才能实现。

研究人员提供的证据表明,AVR Gym可以帮助他们提高受过模拟训练的辅助机器人的性能。其成果显示,VR可以通过让真人与虚拟机器人进行交互,帮助缩小物理模拟与现实之间的差距,从而为实现真正的机器人辅助铺平道路。

原文:
https://arxiv.org/abs/2007.04959v1

其他爆款论文

人脸3D重建新方法 - 用单色图像即可生成高质量的重建图像,且可以适应自遮挡和大范围姿势变形:
https://arxiv.org/abs/2007.03979v1

基于神经架构搜索的新型目标检测架构:
https://ai.googleblog.com/2020/06/spinenet-novel-architecture-for-object.html

利用图卷积神经网络优势,打造一种有效的基于图表的视触觉融合式3D重建方法:
https://arxiv.org/abs/2007.03778v1

Pix2Vox++:一种在准确性和效率上均优于传统方法的新型3D对象重建方法:
https://arxiv.org/abs/2006.12250v2

改进GAN实现语音增强:
https://arxiv.org/abs/2001.05532v2

资源

一个涵盖机器学习论文及代码实现的免费分享社区:
https://paperswithcode.com/methods

Pytorch官方教程免费书籍下载:
https://pytorch.org/deep-learning-with-pytorch

Gradio:仅需几行代码,即可为机器学习模型甚至Python函数生成易用的web界面:
https://gradio.app/

AI大事件

福布斯AI 50排行榜多家公司创始人预测后新冠疫情时代的AI发展空间:
https://www.forbes.com/sites/kenrickcai/2020/07/10/ai-50-founders-post-coronavirus-predictions/#17c8ce6d2ccc

亚马逊官宣将在未来几个月内开始使用无人机运送包裹:
https://www.zdnet.com/article/amazon-unveils-drone-that-will-be-delivering-packages-in-months/

大众创新为AI肺癌筛查提速:
https://www.zdnet.com/article/researchers-find-crowdsourcing-ai-go-together-in-battle-vs-lung-cancer/

相关文章
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
77 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
1天前
|
人工智能
Scaling Laws终结,量化无用,AI大佬都在审视这篇论文
《Scaling Laws for Precision》论文提出“精度感知”的扩展理论,将精度纳入模型发展的核心考量,弥补了传统AI模型发展理论忽视精度的不足。研究发现低精度训练会降低模型的有效参数计数,影响性能,并预测了低精度训练和后训练量化带来的损失。作者通过大量实验验证了理论的可靠性和有效性,为计算资源有限情况下如何平衡模型规模和精度提供了新思路。然而,该研究也引发了关于精度与性能权衡复杂性的争议。
40 27
|
20天前
|
存储 人工智能 人机交互
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
PC Agent 是上海交通大学与 GAIR 实验室联合推出的智能 AI 系统,能够模拟人类认知过程,自动化执行复杂的数字任务,如组织研究材料、起草报告等,展现了卓越的数据效率和实际应用潜力。
112 1
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
|
2月前
|
人工智能 自然语言处理 机器人
手把手带你搭建一个语音对话机器人,5分钟定制个人AI小助手(新手入门篇)
本文介绍了如何从零开始搭建一个语音对话机器人,涵盖自动语音识别(ASR)、自然语言处理(NLP)和文本到语音合成(TTS)三大核心模块。通过使用开源工具如FunASR、LLaMA3-8B和ChatTTS,以及FastAPI和Gradio等技术,详细指导读者轻松实现个人AI小助手的构建,适合技术新手快速上手。
499 1
|
3月前
|
人工智能 自然语言处理 算法
几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
【10月更文挑战第8天】几款宝藏级AI阅读工具推荐!论文分析、文档总结必备神器!
215 1
|
2月前
|
机器学习/深度学习 人工智能 运维
电话机器人源码-智能ai系统-freeswitch-smartivr呼叫中心-crm
电话机器人源码-智能ai系统-freeswitch-smartivr呼叫中心-crm
79 0
|
8月前
|
机器学习/深度学习 人工智能 安全
机器人+AI+MD模拟,加速材料发现和设计,发现全天然塑料替代品
【5月更文挑战第16天】研究人员结合机器人自动化、AI和MD模拟,加速发现全天然塑料替代品,以解决塑料污染问题。通过机器人制备286种纳米复合材料,使用SVM和ANN模型预测其性能,实现高效设计。模型成功推荐了具有特定性能的生物降解替代品,但面临样品制备自动化、天然成分质量控制、成本和生命周期分析等挑战。论文链接:[Nature article](https://www.nature.com/articles/s41565-024-01635-z)
117 3
|
4月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
83 4
|
6月前
|
人工智能 自然语言处理 机器人
客户在哪儿AI的ToB获客服务和AI外呼机器人的有何不同
客户在哪儿AI的ToB获客服务 VS AI外呼机器人的ToB获客服务。
|
6月前
|
人工智能 自然语言处理 小程序
政务VR导航:跨界融合AI人工智能与大数据分析,打造全方位智能政务服务
政务大厅引入智能导航系统,解决寻路难、指引不足及咨询台压力大的问题。VR导视与AI助手提供在线预览、VR路线指引、智能客服和小程序服务,提高办事效率,减轻咨询台工作,优化群众体验,塑造智慧政务形象。通过线上线下结合,实现政务服务的高效便民。
138 0
政务VR导航:跨界融合AI人工智能与大数据分析,打造全方位智能政务服务