10亿参数的AI模型SEER「一视同仁」:服务富人,也服务全世界

简介: 一个主要以欧美家庭图片为训练内容的识别系统碰到「尼泊尔」家庭图片时,可能就识别不出,而无需标记、10亿参数的AI模型SEER表现惊人,它「一视同仁」,认得出美国厨房,也认得出尼泊尔厨房。

使用经过挑选和标记的数据集对人工智能系统进行训练,产生了专门的人工智能模型,擅长对象识别等任务。 但是仅仅依靠这种方法也有实际的局限性,其中一个我们认为特别重要: 这样的系统可能难以识别那些日常生活中很常见,但是在训练人工智能系统的数据中「没有被充分代表」的对象。

60.jpg

尤其是,关于训练哪些图片以及如何给它们贴标签的选择,这可能在不经意间引入「偏见」。 例如,一个主要以「美国和欧洲」家庭图片为训练内容的物体识别系统在被要求识别「尼泊尔」一个家中的物体时,可能难以取得同样好的效果。 这是我们对SEER感到兴奋的原因之一,SEER是我们开发的一种新的高性能计算机视觉系统。
通过利用自监督学习,SEER可以从任何数字图片集中学习,而不需要研究人员来挑选和标记每个对象。 初步评估表明,SEER在识别物体方面比传统的计算机视觉系统表现更好,这些物体虽然来自数十亿人的生活,但在用于训练人工智能系统的传统图片数据集中「体现较少」。 我们希望利用SEER使人工智能更好地为每个人服务,而不仅仅是那些一直以来受益最多的群体。 

从全球各地采集图片「考一考」人工智能

我们在2019年的计算机视觉系统偏差研究中使用了「Dollar Street数据集」,对SEER进行测试。SEER给出的结果令人兴奋,自监督学习让人工智能更好地为世界各地的人服务。


61.png

Dollar Street数据集——世界不同国家和地区不同收入的家庭

例如下面这张来自尼泊尔一个家庭的图,SEER的识别结果是:调料、药、碗、水果、社交饮酒 监督学习模型的识别结果是:清洗设备、厨房洗涤盆、展示物品、碗、水果、炊具、锅 所以,SEER正确地识别了图片中的物体,而传统的系统则没有。


                                   62.jpg

                                                         图源:Facebook AI Blog 

下面这张图来自一个中国家庭,SEER的识别结果是:炊具、炉子、锅、工具 监督学习模型的识别结果是:前门上的锁、电源开关、炊具、挂钟、炉灶 所以,SEER 正确地识别出了一个炉子,而传统的训练系统却没有。 

                           image.jpeg

                                                  图源:Facebook AI Blog

 下面这张照片显示了印度的一条小街道。SEER的识别结果是:自行车、街景、垃圾、菜地 监督学习模型的识别结果是:水果树、家、自行车、宠物、房顶


image.jpeg


                                                    图源:Facebook AI Blog

AI为人人

自监督学习在提高语言和方言的性能方面已经显示出巨大的前景,因为这些语言和方言没有大量的数字化文本作为标记的训练数据来使用。 SEER能够在上述例子中更好地进行物体识别,这是另一个令人兴奋的结果,因为该模型是在没有任何数据整理的情况下在随机的互联网图像上训练的。 这表明,用于训练SEER的自监督方法可能会对建立人工智能系统的努力产生巨大影响,这种系统不仅能有效地服务富人,而且能有效地服务整个世界。这些努力只是开始,但很明显,我们正在一条非常令人兴奋的进步之路上。 

相关文章
|
2天前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。
|
1天前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
1天前
|
人工智能 测试技术 PyTorch
AI计算机视觉笔记二十四:YOLOP 训练+测试+模型评估
本文介绍了通过正点原子的ATK-3568了解并实现YOLOP(You Only Look Once for Panoptic Driving Perception)的过程,包括训练、测试、转换为ONNX格式及在ONNX Runtime上的部署。YOLOP由华中科技大学团队于2021年发布,可在Jetson TX2上达到23FPS,实现了目标检测、可行驶区域分割和车道线检测的多任务学习。文章详细记录了环境搭建、训练数据准备、模型转换和测试等步骤,并解决了ONNX转换过程中的问题。
|
8天前
|
机器学习/深度学习 人工智能
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【9月更文挑战第1天】麻省理工学院(MIT)研究人员开发的深度学习AI模型,在乳腺癌早期预警方面取得突破性进展,相比传统方法提前5年预警癌症,准确率超过90%。此成果不仅在医学界引起轰动,还获得了人工智能领域知名学者Yann LeCun的高度评价。尽管面临准确性和可解释性的挑战,但该研究展示了AI在医疗领域的巨大潜力,有望革新乳腺癌的早期筛查和诊断方式。论文详情见[链接]。
16 3
|
11天前
|
机器学习/深度学习 人工智能 Android开发
揭秘AI编程:从零开始构建你的第一个机器学习模型移动应用开发之旅:从新手到专家
【8月更文挑战第29天】本文将带你走进人工智能的奇妙世界,一起探索如何从零开始构建一个机器学习模型。我们将一步步解析整个过程,包括数据收集、预处理、模型选择、训练和测试等步骤,让你对AI编程有一个全面而深入的理解。无论你是AI初学者,还是有一定基础的开发者,都能在这篇文章中找到你需要的信息和启示。让我们一起开启这段激动人心的AI编程之旅吧! 【8月更文挑战第29天】在这篇文章中,我们将探索移动应用开发的奇妙世界。无论你是刚刚踏入这个领域的新手,还是已经有一定经验的开发者,这篇文章都将为你提供有价值的信息和指导。我们将从基础开始,逐步深入到更复杂的主题,包括移动操作系统的选择、开发工具的使用、
|
20天前
|
机器学习/深度学习 人工智能 人机交互
ICML 2024:AI也会刷抖音!清华领衔发布短视频全模态理解新模型
【8月更文挑战第20天】SALMONN是由清华大学在ICML 2024发表的一种开创性的多模态模型,专为短视频全模态理解设计。它集成了预训练文本大模型与语音、音频编码器,能直接处理多样音频输入,在自动语音识别、翻译、情绪识别等任务中表现出色。SALMONN展现了令人兴奋的新能力,如翻译未训练语言和基于语音的问答。通过少样本激活微调,可进一步发掘其跨模态潜能。尽管如此,模型的计算成本和泛化能力仍是待克服的挑战。SALMONN标志着AI在具备通用听觉理解方面迈出重要一步。[论文链接: https://arxiv.org/abs/2310.13289]
45 3
|
8天前
|
机器学习/深度学习 人工智能 自动驾驶
探索AI的魔法:用Python构建你的第一个机器学习模型
【8月更文挑战第31天】在这个数字时代,人工智能(AI)已经渗透到我们生活的方方面面。从智能助手到自动驾驶汽车,AI正在改变世界。本文将带你走进AI的世界,通过Python编程语言,一步步教你如何构建第一个机器学习模型。无论你是编程新手还是有经验的开发者,这篇文章都将为你打开新世界的大门,让你体验到创造智能程序的乐趣和成就感。所以,让我们一起开始这段激动人心的旅程吧!
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的正则化技术:提升模型泛化能力的关键策略探索AI的奥秘:深度学习与神经网络
【8月更文挑战第27天】在深度学习的探索旅程中,我们常常遭遇模型过拟合的困境,就像是一位探险者在茫茫林海中迷失方向。本文将作为你的指南针,指引你理解并应用正则化技术,这一强大的工具能够帮助我们的模型更好地泛化于未见数据,就如同在未知领域中找到正确的路径。我们将从简单的L1和L2正则化出发,逐步深入到更为复杂的丢弃(Dropout)和数据增强等策略,为你的深度学习之旅提供坚实的支持。
|
16天前
|
机器学习/深度学习 数据采集 人工智能
揭秘AI编程:打造你的第一个机器学习模型
【8月更文挑战第24天】本文将带你走进人工智能编程的奇妙世界,从基础理论到实践操作,一步步构建你的首个机器学习模型。我们将通过一个简单的分类问题,展示如何收集数据、选择算法、训练模型并进行评估。文章末尾附有代码示例,助你理解并实现自己的AI项目。
30 0
|
19天前
|
机器学习/深度学习 人工智能 PyTorch
"揭秘AI绘画魔法:一键生成梦幻图像,稳定扩散模型带你开启视觉奇迹之旅!"
【8月更文挑战第21天】稳定扩散(Stable Diffusion)是基于深度学习的模型,能根据文本生成高质量图像,在AI领域备受瞩目,革新了创意产业。本文介绍稳定扩散模型原理及使用步骤:环境搭建需Python与PyTorch;获取并加载预训练模型;定义文本描述后编码成向量输入模型生成图像。此外,还可调整参数定制图像风格,或使用特定数据集进行微调。掌握这项技术将极大提升创意表现力。
28 0