一周AI最火论文 | 迈向强人工智能的四个步骤

简介: 一周AI最火论文 | 迈向强人工智能的四个步骤

本周关键词:步态分析、移动端机器学习模型、3D纹理重建

本周最佳学术研究

人工智能的下一个十年:迈向强人工智能的四个步骤

我们能做些什么来开发更“聪明”的智能AI系统?

研究自然和人工智能的研究员加里·马库斯(Gary Marcus)的答案是:我们当然能!

马库斯(Marcus)最近发布了一篇新论文,该论文针对人工智能系统的四个步骤进行了设计,有助于实现更强大的AI系统。该论文是对他去年在加拿大蒙特利尔与Yoshua Bengio进行讨论的反思,那次辩论是由蒙特利尔AI的Vince Boucher组织的。

他认为,最近在AI和机器学习方面的研究很大程度上强调了通用学习和越来越大的训练集以及越来越多的计算。

而与这种潮流相反,他提出了一种以认知模型为中心的,知识驱动的,基于推理的方法,该方法可以为比当前功能更丰富,更鲁棒的AI提供资源。

Marcus提倡遵循以下四个步骤来开发 AI 系统,他认为这将有助于我们在未来十年开发出更丰富、更智能的AI系统:

● 混合神经符号体系结构的初步开发;

● 构建丰富的、部分固有的认知框架和大规模的知识数据库;

● 开发用于此类框架的抽象推理的工具;

● 用于表示和归纳认知模型的更复杂的机制。

原文:

https://arxiv.org/ftp/arxiv/papers/2002/2002.06177.pdf

使用医疗保健领域的移动远程机器人进行基于RGB摄像机的单个步态分析

如今,用于监视非临床环境中用户健康的高级医疗设备发展得很快。此类设备可以进行实时医疗保健监控,让用户参与到监控之中并为他们提供长期医疗支持。此外,它们还减少了用户们花费在治疗上的时间以及需要去医院的时间。

其中一些健康技术有助于进行步态分析,这一程序已广泛用于关节矫正和评估主要针对老年人的下肢或脊柱问题。为了使此类技术更有效地发挥作用,必须提高它们所依赖的软件和硬件的工作效率。

在近日的一项研究中,研究人员试图改善步态分析的硬件和软件组件。他们使用安装在移动遥控机器人上的低成本RGB摄像头设计了一种新型的无标记步态分析设备。远程机器人是半自动机器人,可以使用无线网络进行远程控制。该设备支持远程控制、实时视频聊天、自动应答和自平衡。

他们还使用了最新的2D和3D人体姿势估计算法Openpose和VNect来说明如何在资源匮乏的环境中运行机器学习模型。

在使用手动标记的2D和3D地面真实数据测试了该方法后,结果表明,与商用多摄像机运动捕捉系统相比,该方法具有竞争优势,并且硬件成本更低

这是朝着在家庭环境中进行稳健的步态分析迈出的一大步,这反过来又可以实现早期医疗干预并减少用户的医疗费用。

一个Demo产品已经完成了开发,可以用于演示移动机器人是如何促进这一技术在现实生活中的应用。研究人员认为,未来的工作应集中在提升人类下肢估计的准确性和改善机器人性能上。

iOS App的代码已经开源:

https://github.com/ziyangwang007/Realtime-Openpose-on-iOS-with-Double-Robot

原文:

https://arxiv.org/abs/2002.04700v2

个用于智能视频重编开源框架

谷歌AI最近宣布推出AutoFlip,即一种用于智能视频的开源框架。 AutoFlip是建立在MediaPipe框架的基础上的,MediaPipe框架支持开发用于处理时间序列多模式数据的管道。以视频和目标尺寸(风景,正方形,肖像等)为输入,AutoFlip会分析视频内容,制定最佳的跟踪和裁剪策略,并以所需的宽高比生成具有相同持续时间的输出视频。

AutoFlip利用先进的对象检测和跟踪技术来智能地理解视频内容,从而为智能视频重新格式化提供了一种全自动解决方案。AutoFlip会检测表示场景变化的构图变化,以便隔离场景进行处理。在每个镜头中,视频分析会通过选择针对内容优化的相机模式和路径,在重新构图之前识别出明显的内容

Google研究人员还在不断改善AutoFlip,并呼吁开源社区中的开发商和电影制片人为这一框架做出贡献。

原文:

https://ai.googleblog.com/2020/02/autoflip-open-source-framework-for.html


移动端机器学习模型缺乏保护


在手机软件中,模型保护的应用有多广?他们的鲁棒性有多强?窃取一个模型的成本是多少?

这篇论文试图解答以上这些问题。这个问题值得讨论的原因在于,现在数以亿计的未受保护设备在使用现有的机学习模型,而这些模型都是开源的,这就导致这些设备有可能受到攻击。

研究员们建立了一个简单的应用程序来作为数据分析管道,并用此分析了46,753个流行应用程序。他们发现了1468个包含机器学习的应用程序。

以下是他们的发现:41%使用机器学习的应用程序根本不保护其模型,并且其他人可以从应用程序包中窃取这些模型。即使一部分应用程序使用了模型保护或对模型加密了,研究人员也能够通过简单的动态分析手段从其中的66%程序里拿到原模型。提取的模型类型主要来自商业产品,用途上包括面部识别、活动检测、ID /银行卡识别和恶意软件检测。这些模型如果泄漏,其财务影响可能达数百万美元。

系统安全在现在的系统里是至关重要的一部分。这项研究表明,设备上的未加密或简单加密的机器学习模型目前有泄露的高风险,由于其经济效益,攻击者极有可能窃取这些模型。本文讨论了使用机器学习模型的设备安全性问题,并讨论了其中的技术难点。

这项工作致力于启发未来的研究人员,希望他们能开发出针对手机端的,具有更强鲁棒性和实际性的机器学习模型。


原文:

https://arxiv.org/abs/2002.07687v1


使用单视图RGB图像对人体进行3D纹理的重建

PeelNet是一种端到端的生成对抗性框架,这篇论文旨在使用PeelNet解决从单个RGB图像对人体进行纹理3D重建的问题。

目前,从单个图像对人的形状和姿势进行3D重构仍然是一个巨大的挑战。造成这个难点的原因包括,严重的遮挡、多样化的服装以及亮度的变化等问题。

研究的主要贡献:

  • 提供了一种处理自我遮挡问题的新方法:通过剥离的深度和RGB贴图来表示3D人体;
  • 提供了一个完整的端到端的处理方式,这种方式使用了对抗性方法,在给定单个RGB图像的情况下重建具有纹理的3D人体。

3D人体的人体形状、姿势和纹理,在娱乐业,电子商务,医疗保健(物理疗法),基于移动的AR/VR平台等方面都有很高应用。如果带纹理的3D人体重建技术提高,这些平台可以从中受益。

这篇论文中提出的端到端框架效率更高,推理时间更短,并能生成可靠的3D重建。但是,由于缺少影像证据的3D切点,技术效率低下的问题目前没有得到解决。

研究人员计划通过加入一个人体网络模板来解决这个问题,可以在将来恢复这些3D切点。

原文:

https://arxiv.org/abs/2002.06664v1

其他爆款论文

关于鲁棒性的量化:

https://arxiv.org/abs/2002.06664v1

合成数据生成可提高机器学习模型训练数据的多样性:

https://ai.googleblog.com/2020/02/generating-diverse-synthetic-medical.html

Pseudo-LiDAR ++将遥远物体的检测精度提高了40%:

https://arxiv.org/abs/1906.06310v3

使用深度学习,从2D视频生成多人3D动画的小型有效解决方案:

https://arxiv.org/abs/2002.02792v1

资源放送

Excel中的计算机视觉基础:

https://github.com/amzn/computer-vision-basics-in-microsoft-excel

AI大事件

了解AI方向最新的十大重量级人物:

https://www.verdict.co.uk/top-ai-influencers/

怎样告别世界上最成问题的致病细菌?

https://news.mit.edu/2020/artificial-intelligence-identifies-new-antibiotic-0220

通过深度神经网络AI,来重建毕加索绘画中隐藏的神秘影像:

https://thenewstack.io/deep-neural-network-ai-reconstructs-mysterious-image-hidden-in-picasso-painting/?utm_campaign=Artificial%2BIntelligence%2BWeekly&utm_medium=email&utm_source=Artificial_Intelligence_Weekly_149

谷歌云更新了Dialogflow,以实现Better Contact Center AI的代理:

https://www.zdnet.com/article/google-cloud-updates-diagflow-for-better-contact-center-ai-agents/

五角大楼发布了其使用人工智能的准则:

https://www.defenseone.com/technology/2020/02/pentagon-adopt-detailed-principles-using-ai/163185/?utm_campaign=Artificial%2BIntelligence%2BWeekly&utm_medium=email&utm_source=Artificial_Intelligence_Weekly_149

优秀的文本生成工具,重写Wikipedia文章中的不准确句子,并同时保留人性化的语法和样式:

https://news.mit.edu/2020/automated-rewrite-wikipedia-articles-0212

相关文章
|
9天前
|
人工智能 缓存 异构计算
云原生AI加速生成式人工智能应用的部署构建
本文探讨了云原生技术背景下,尤其是Kubernetes和容器技术的发展,对模型推理服务带来的挑战与优化策略。文中详细介绍了Knative的弹性扩展机制,包括HPA和CronHPA,以及针对传统弹性扩展“滞后”问题提出的AHPA(高级弹性预测)。此外,文章重点介绍了Fluid项目,它通过分布式缓存优化了模型加载的I/O操作,显著缩短了推理服务的冷启动时间,特别是在处理大规模并发请求时表现出色。通过实际案例,展示了Fluid在vLLM和Qwen模型推理中的应用效果,证明了其在提高模型推理效率和响应速度方面的优势。
云原生AI加速生成式人工智能应用的部署构建
|
23天前
|
机器学习/深度学习 人工智能 监控
探索人工智能的伦理困境:我们如何确保AI的道德发展?
在人工智能(AI)技术飞速发展的今天,其伦理问题也日益凸显。本文将探讨AI伦理的重要性,分析当前面临的主要挑战,并提出相应的解决策略。我们将通过具体案例和代码示例,深入理解如何在设计和开发过程中嵌入伦理原则,以确保AI技术的健康发展。
30 11
|
1月前
|
机器学习/深度学习 人工智能 算法
人工智能与医疗健康:AI如何改变生命科学
【10月更文挑战第31天】人工智能(AI)正深刻改变医疗健康和生命科学领域。本文探讨AI在蛋白质结构预测、基因编辑、医学影像诊断和疾病预测等方面的应用,及其对科研进程、医疗创新、服务效率和跨学科融合的深远影响。尽管面临数据隐私和伦理等挑战,AI仍有望为医疗健康带来革命性变革。
101 30
|
1月前
|
机器学习/深度学习 人工智能 机器人
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
1分钟认识:人工智能claude AI _详解CLAUDE在国内怎么使用
Claude AI 是 Anthropic 开发的先进对话式 AI 模型,以信息论之父克劳德·香农命名,体现了其在信息处理和生成方面的卓越能力
|
21天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与未来医疗:AI技术在疾病诊断中的应用前景####
本文探讨了人工智能(AI)在现代医疗领域,尤其是疾病诊断方面的应用潜力和前景。随着技术的不断进步,AI正逐渐改变传统医疗模式,提高诊断的准确性和效率。通过分析当前的技术趋势、具体案例以及面临的挑战,本文旨在为读者提供一个全面的视角,理解AI如何塑造未来医疗的面貌。 ####
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。
|
1月前
|
机器学习/深度学习 人工智能 搜索推荐
人工智能与未来医疗:AI技术如何重塑医疗健康领域###
【10月更文挑战第21天】 一场由AI驱动的医疗革命正在悄然发生,它以前所未有的速度和深度改变着我们对于疾病预防、诊断、治疗及健康管理的认知。本文探讨了AI在医疗领域的多维度应用,包括精准医疗、药物研发加速、远程医疗普及以及患者个性化治疗体验的提升,揭示了这场技术变革背后的深远意义与挑战。 ###
194 6
|
2月前
|
人工智能 自动驾驶 数据安全/隐私保护
人工智能的伦理困境:我们如何确保AI的道德发展?
【10月更文挑战第21天】随着人工智能(AI)技术的飞速发展,其在各行各业的应用日益广泛,从而引发了关于AI伦理和道德问题的讨论。本文将探讨AI伦理的核心问题,分析当前面临的挑战,并提出确保AI道德发展的建议措施。
|
1月前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
179 0