实现人工智能的“想象力”

简介: 南加州大学的一组研究人员正在帮助人工智能想象看不见的东西,这项技术也可能带来更公平的人工智能。

image.png
【51CTO.com快译】首先请在脑海中想象一只橙色的猫。然后,想象同一只猫,皮毛已经变成了煤黑色。现在,想象这样一只猫在长城上昂首阔步。

在上述一系列想象活动中,你大脑中的一系列神经元会基于你之前对世界的认知,快速呈现出不同的图像。也就是说,作为人类,其实很容易一个具有不同属性的对象。但对于计算机来说,尽管深度神经网络在某些任务上取得了可以与人类表现相匹敌甚至超越的突破,但始终无法与人类的“想象力”相抗衡。

如今,一个来自南加州大学的研究团队开发出了一种新的人工智能,可以利用类人的能力想象出某个前所未有的具有不同属性的物体。这篇以Zero-Shot Synthesis with Group-Supervised Learning为题的论文于今年5月7日发表在ICLR2021(深度学习领域的顶级学术会议)会上。

“我们受到人类视觉泛化能力的启发,尝试在机器上模拟人类的想象力,”该研究的主要作者葛云浩说,“人类可以通过不同的属性(例如形状、姿势、位置、颜色)来分离所学知识,然后将它们重新组合,从而想象出一个新的物体。我们的论文试图用神经网络来模拟这个过程。”

人工智能的泛化

假如,你想创建一个生成汽车图像的人工智能系统。理想情况下,你可以为算法提供一些汽车图片,从而让它可以从不同角度生成各种型号、外形、颜色的汽车,从保时捷到庞蒂亚克到皮卡,不一而足。

这是人工智能长期追求的目标之一:创建可以进行推理的模型。达成这一目标就意味着,给定几个示例,模型就能够提取基本规则,并将它们应用到大量前所未见的新示例中。但机器通常是根据样本特征进行训练的,比如像素,而不考虑对象的属性。

关于“想象”的科学

在这项新研究中,研究人员试图用一种“退纠缠(disentanglement)”的概念来克服这一限制。“退纠缠”可以用于“深度伪造(deepfake)”,葛云浩提到,通过“退纠缠”人的脸部表情和特征进行“换脸”,人们可以合成新的图像和视频,用另一个人替换原主身份,同时保留原来的动作。与之相似,新方法采用一组样本图像——而不是像传统算法那样一次一个样本——并挖掘它们之间的相似性以实现所谓的“可控退纠缠表征学习”。然后通过重新组合这些知识来实现“可控的新图像合成”,或者你可以称之为“想象”。

他以《变形金刚》为例进行了说明:它可以在电影中取材——威震天的形状、大黄蜂的颜色、纽约时代广场的背景。合成结果就是一辆大黄蜂颜色的威震天汽车在时代广场上飞驰,即使训练期间并没有出现过这个样本。

这个过程类似于人类的推理:当一个人看到一个物体的颜色时,我们可以轻松地通过用新颜色替换原始色来将其应用于任何其他物体。使用他们的技术,这个团队生成了一个包含 156 万张图像的新数据集,有助于该领域的未来研究。

理解世界

虽然“退纠缠”并不是个新点子,但研究人员表示,他们的框架几乎可以和任何类型的数据或知识兼容,这就扩大了应用机会。比如,通过将敏感属性从等式中完全移除,将种族和性别相关知识分解,从而推进人工智能更加公平。

再比如,在医学领域,它可以帮助医生和生物学家发现更多有用的药物,通过将药物功能与其他特性分开,然后将它们重新组合以合成新药;在自动驾驶领域,允许自动驾驶汽车想象并避免在训练过程中从未见过的危险场景,从而推进创建更安全的人工智能。

计算机科学教授洛伦·伊蒂说:“深度学习已经在很多领域展示了无与伦比的性能和前景,但这往往是通过浅层模仿达成,并没有更深入地了解使每个个体独一无二的属性。这种新的‘退纠缠’方法第一次真正释放了人工智能系统的想象力,使它们更接近人类对世界的理解。”


本文转载自51CTO,本文一切观点和机器智能技术圈子无关。原文链接
免费体验百种AI能力以及试用热门离线SDK:【点此跳转】

目录
相关文章
|
机器学习/深度学习 人工智能 算法
人工智能绘画的时代下到底是谁在主导,是人类的想象力,还是AI的创造力?
人工智能绘画的时代下到底是谁在主导,是人类的想象力,还是AI的创造力?
378 0
|
机器学习/深度学习 人工智能 算法
|
机器学习/深度学习 存储 人工智能
AI职场突围战:夸克应用+生成式人工智能认证,驱动“打工人”核心竞争力!
在AI浪潮推动下,生成式人工智能(GAI)成为职场必备工具。文中对比了夸克、豆包、DeepSeek和元宝四大AI应用,夸克以“超级入口”定位脱颖而出。同时,GAI认证为职场人士提供系统学习平台,与夸克结合助力职业发展。文章还探讨了职场人士如何通过加强学习、关注技术趋势及培养合规意识,在AI时代把握机遇。
|
机器学习/深度学习 人工智能 自然语言处理
人工智能应用领域有哪些
本文全面探讨了人工智能(AI)的应用领域和技术核心,涵盖医疗、交通、金融、教育、制造、零售等多个行业,并分析了AI技术的局限性及规避策略。同时,介绍了生成式人工智能认证项目的意义与展望。尽管AI发展面临数据依赖和算法可解释性等问题,但通过优化策略和经验验证,可推动其健康发展。未来,AI将在更多领域发挥重要作用,助力社会进步。
|
机器学习/深度学习 人工智能 运维
人工智能在事件管理中的应用
人工智能在事件管理中的应用
421 21
|
机器学习/深度学习 人工智能 搜索推荐
探索人工智能在现代医疗中的革新应用
本文深入探讨了人工智能(AI)技术在医疗领域的最新进展,重点分析了AI如何通过提高诊断准确性、个性化治疗方案的制定以及优化患者管理流程来革新现代医疗。文章还讨论了AI技术面临的挑战和未来发展趋势,为读者提供了一个全面了解AI在医疗领域应用的视角。
346 11
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在医疗诊断中的应用与前景####
本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状、面临的挑战及未来发展趋势。通过分析AI如何辅助医生进行疾病诊断,提高诊断效率和准确性,以及其在个性化医疗中的潜力,文章揭示了AI技术对医疗行业变革的推动作用。同时,也指出了数据隐私、算法偏见等伦理问题,并展望了AI与人类医生协同工作的前景。 ####
1035 0
|
机器学习/深度学习 数据采集 人工智能
深度探索:人工智能在医疗影像诊断中的应用与挑战####
本文旨在深入剖析人工智能(AI)技术在医疗影像诊断领域的最新进展、核心优势、面临的挑战及未来发展趋势。通过综合分析当前AI算法在提高诊断准确性、效率及可解释性方面的贡献,结合具体案例,揭示其在临床实践中的实际价值与潜在局限。文章还展望了AI如何与其他先进技术融合,以推动医疗影像学迈向更高层次的智能化时代。 ####
1212 35
|
机器学习/深度学习 人工智能 自然语言处理
探索未来编程:Python在人工智能领域的深度应用与前景###
本文将深入探讨Python语言在人工智能(AI)领域的广泛应用,从基础原理到前沿实践,揭示其如何成为推动AI技术创新的关键力量。通过分析Python的简洁性、灵活性以及丰富的库支持,展现其在机器学习、深度学习、自然语言处理等子领域的卓越贡献,并展望Python在未来AI发展中的核心地位与潜在变革。 ###
|
人工智能 缓存 异构计算
云原生AI加速生成式人工智能应用的部署构建
本文探讨了云原生技术背景下,尤其是Kubernetes和容器技术的发展,对模型推理服务带来的挑战与优化策略。文中详细介绍了Knative的弹性扩展机制,包括HPA和CronHPA,以及针对传统弹性扩展“滞后”问题提出的AHPA(高级弹性预测)。此外,文章重点介绍了Fluid项目,它通过分布式缓存优化了模型加载的I/O操作,显著缩短了推理服务的冷启动时间,特别是在处理大规模并发请求时表现出色。通过实际案例,展示了Fluid在vLLM和Qwen模型推理中的应用效果,证明了其在提高模型推理效率和响应速度方面的优势。
云原生AI加速生成式人工智能应用的部署构建

热门文章

最新文章