一周AI最火论文 | 和机器人一起“云”健身,VR健身房助力人机交互

简介: 一周AI最火论文 | 和机器人一起“云”健身,VR健身房助力人机交互

本周关键词:AutoML、强化学习、VR

本周最佳学术研究

用AutoML-Zero从零开始发展的机器学习算法

在最近的一篇论文中,为了鼓励更多AutoML的研究,Google AI展示了从头成功开发ML算法的可能性。

以前,AutoML的作用是,通过神经体系结构搜索(NAS)技术,对不同需求自动生成并设计出相应的机器学习算法。

想使用NAS,需要专家来构建复杂的设计层来帮助构建神经网络。但是,在研究员称为AutoML-Zero的这种新方法中,Google AI展示了一种替代方法,可以自动发现以基本数学运算为基础的完整ML算法。

在小图像的分类问题上,该新方法重新发现了基本的机器学习技术,例如带有反向传播的2层神经网络,线性回归等。所获得的结果证明了,使用算法自动发现机器学习算法是可行的,这对解决未来的难题可能很有借鉴意义。

原文:
https://ai.googleblog.com/2020/07/automl-zero-evolving-code-that-learns.html

深层次变分自编码器

在本文中,NVIDIA研究人员提出了一种称为Nouveau VAE的深度变分自动编码器(VAE),该编码器使用深度方向可分离的卷积以及批归一化,来生成大型高质量图像。

NVAE的设计着眼于解决两个主要挑战,首先是设计针对VAE的具有强表现力的神经网络,第二则是在保持训练稳定性的同时,扩展训练到更多层,让它适合更多不同的图像尺寸。

这项工作表明,NVAE在MNIST,CIFAR-10和CelebA HQ数据集中基于非自回归似然性的模型中,得到了最优的结果。NVAE也为FFHQ提供了强有力的基准线。例如,在CIFAR-10上,NVAE将最新技术从每维2.98位提高到了2.91位,并在CelebA HQ上生成了高质量图像。据研究人员称,NVAE是第一个成功应用于大尺寸256×256像素自然图像的VAE。

原文:
https://arxiv.org/abs/2007.03898

有限资源深度学习的中高效的数据和计算设计

深度学习最近已越来越靠近边缘设备,这为创造需要实时分析数据的新应用程序,提供了可能。但是,深度神经网络的计算量很大,需要大量的数据进行训练以及复杂的体系结构,才能实现最新的性能。

本文中,为了实现更好的泛化和更高效的推理,研究人员试图通过结合量化和等方差的方式来解决此问题。他们设计并测试了MobileNetV2的等变版本,并通过模型量化对其进行了进一步优化,实现了更高效的推理。结果显示,这个设计对Patch Camelyon(PCam)医疗数据集具有最先进的性能,同时计算效率更高。

原文:
https://arxiv.org/abs/2004.09691v2

Duality — 强化学习新方法

谷歌AI研究人员开发了一种用于强化学习(RL)的新方法,可以实现既实用又符合数学原理的算法。这意味着所得到的算法可避免使用非常粗略的近似来实现其数学基础原理。

基于凸对偶性所得到的方法是一种经过充分研究的数学工具,用于将以一种形式表示的问题转换为其他形式的等效问题,从而可能更利于计算。谷歌AI研究人员所开发的在强化学习(RL)中应用对偶性的特定方法,将传统的约束满足式数学问题转换为无约束且更实际的数学问题。

他们希望强化学习和(凸)优化之间的联系可以促进这两个领域研究人员之间的进一步合作。

原文:
https://ai.googleblog.com/2020/07/duality-new-approach-to-reinforcement.html

利用真人互动改进虚拟辅助机器人

在这个项目中,研究人员提出了辅助虚拟现实健身房(AVR Gym),这是一个开源框架,用于真人与虚拟辅助机器人的交互。

研究人员认为,多功能的机器人护工可以使全球数百万人(包括老年人和残疾人)受益。

由于对如何使机器人护工通过物理模拟学习与人互动的研究仍然是一个巨大的挑战,因此他们提出的方法可能还需要很长时间才能实现。

研究人员提供的证据表明,AVR Gym可以帮助他们提高受过模拟训练的辅助机器人的性能。其成果显示,VR可以通过让真人与虚拟机器人进行交互,帮助缩小物理模拟与现实之间的差距,从而为实现真正的机器人辅助铺平道路。

原文:
https://arxiv.org/abs/2007.04959v1

其他爆款论文

人脸3D重建新方法 - 用单色图像即可生成高质量的重建图像,且可以适应自遮挡和大范围姿势变形:
https://arxiv.org/abs/2007.03979v1

基于神经架构搜索的新型目标检测架构:
https://ai.googleblog.com/2020/06/spinenet-novel-architecture-for-object.html

利用图卷积神经网络优势,打造一种有效的基于图表的视触觉融合式3D重建方法:
https://arxiv.org/abs/2007.03778v1

Pix2Vox++:一种在准确性和效率上均优于传统方法的新型3D对象重建方法:
https://arxiv.org/abs/2006.12250v2

改进GAN实现语音增强:
https://arxiv.org/abs/2001.05532v2

资源

一个涵盖机器学习论文及代码实现的免费分享社区:
https://paperswithcode.com/methods

Pytorch官方教程免费书籍下载:
https://pytorch.org/deep-learning-with-pytorch

Gradio:仅需几行代码,即可为机器学习模型甚至Python函数生成易用的web界面:
https://gradio.app/

AI大事件

福布斯AI 50排行榜多家公司创始人预测后新冠疫情时代的AI发展空间:
https://www.forbes.com/sites/kenrickcai/2020/07/10/ai-50-founders-post-coronavirus-predictions/#17c8ce6d2ccc

亚马逊官宣将在未来几个月内开始使用无人机运送包裹:
https://www.zdnet.com/article/amazon-unveils-drone-that-will-be-delivering-packages-in-months/

大众创新为AI肺癌筛查提速:
https://www.zdnet.com/article/researchers-find-crowdsourcing-ai-go-together-in-battle-vs-lung-cancer/

相关文章
|
6月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
1074 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
7月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
472 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
7月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
417 10
|
7月前
|
人工智能 机器人 Serverless
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
当云计算遇见具身智能,AI咖啡开启零售新体验。用户通过手机生成个性化图像,云端AI快速渲染,机器人精准复刻于咖啡奶泡之上,90秒内完成一杯可饮用的艺术品。该方案融合阿里云FunctionAI生图能力与安诺机器人高精度执行系统,实现AIGC创意到实体呈现的闭环,为线下零售提供低成本、高互动、易部署的智能化升级路径,已在商场、机场、展馆等场景落地应用。
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
|
7月前
|
机器学习/深度学习 人工智能 机器人
AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人
AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人
|
7月前
|
人工智能 Java 机器人
基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API
Spring AI Alibaba集成Ollama,基于Java构建本地大模型应用,支持流式对话、knife4j接口可视化,实现高隐私、免API密钥的离线AI服务。
6191 2
基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API
|
7月前
|
存储 人工智能 监控
LangGraph实战:从零构建智能交易机器人,让多个AI智能体像投资团队一样协作
如今的量化交易已远超传统技术指标,迈向多智能体协作的新时代。本文介绍了一个基于 **LangGraph** 构建的多智能体交易系统,模拟真实投资机构的运作流程:数据分析师收集市场情报,研究员展开多空辩论,交易员制定策略,风险团队多角度评估,最终由投资组合经理做出决策。系统具备记忆学习能力,通过每次交易积累经验,持续优化决策质量。
1267 8
LangGraph实战:从零构建智能交易机器人,让多个AI智能体像投资团队一样协作
|
7月前
|
人工智能 算法 开发者
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
613 1
|
7月前
|
存储 人工智能 机器人
科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口
科技云报到:西湖大学、智元机器人都选它,存储成为AI下一个风口
198 1
|
8月前
|
存储 人工智能 机器人
别再只做聊天机器人:AI 应用商业闭环的工程落地指南,免费体验中
本文介绍了如何通过阿里云百炼平台创建一个星座运势分析AI智能体,并集成支付宝MCP服务实现支付闭环。解决AI产品无法直接变现的问题,完成“服务-支付-交易”全流程闭环,帮助开发者快速实现商业化。

热门文章

最新文章

下一篇
开通oss服务