AI大模型企业应用实战-什么是zero-shot, one-shot和few-shot Learning

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
视觉智能开放平台,视频资源包5000点
简介: 【8月更文挑战第17天】

1 Zero-shot learning

零样本学习。零样本学习是一种机器学习模式,其中预训练的深度学习模型被要求对一个类别的样本进行泛化。零样本学习的理念类似于人类自然地发现数据类别之间的相似性,并以此来训练机器进行识别。

零样本学习的主要目标是能够在没有任何训练样本的情况下预测结果;机器必须识别训练期间未见过的类别的物体。零样本学习基于在训练期间输入的实例中已有的知识进行知识转移。

零样本学习旨在学习中间语义层和属性,然后将其应用于预测未见过的新类别数据。

例如,我们见过马,但从未见过斑马。如果有人告诉你斑马看起来像马但有黑白条纹,当你看到斑马时,你可能会认出来。

1.1 任务定义

利用训练集数据训练模型,使得模型能够对测试集的对象进行分类,但是训练集类别和测试集类别之间没有交集;期间需要借助类别的描述,来建立训练集和测试集之间的联系,从而使得模型有效。

Zero-shot learning 就是希望我们的模型能够对其从没见过的类别进行分类,让机器具有推理能力,实现真正的智能。其中零次(Zero-shot)是指对于要分类的类别对象,一次也不学习。

1.2 零样本学习如何工作?

零样本学习的工作原理如下:

  • 理解特征:计算机不仅从例子中学习,还学习描述不同事物的重要特征。例如,如果它在学习动物,它可能会知道猫有毛、胡须和锋利的爪子。
  • 泛化:一旦理解了这些特征,计算机可以用它们来识别之前未见过的新事物。例如,如果它知道有毛和胡须的动物通常是猫,它可以猜测新看到的有这些特征的动物很可能是猫。
  • 使用线索:有时,计算机会获得额外的信息来帮助它理解新事物。这可能是描述或标签,告诉它不同类别的特征。
  • 测试:最后,我们测试计算机,看它能多好地识别新事物。我们给它未训练过的事物的图片或描述,看它是否能根据已学特征正确识别它们。

总体而言,零样本学习就像教计算机理解事物的本质,使它能对遇到的新事物做出有根据的猜测。这在我们无法在训练期间展示给计算机每个可能的例子时非常有用,使其能够自我学习和适应新情况。

1.3 实例

假设我们的模型已经能够识别马、老虎和熊猫了,现在需要该模型也识别斑马,那么我们需要告诉模型,怎样的对象才是斑马,但是并不能直接让模型看见斑马。所以模型需要知道的信息是马的样本、老虎的样本、熊猫的样本和样本的标签,以及关于前三种动物和斑马的描述。

通俗点说就是:假设小暗(纯粹因为不想用小明)和爸爸,到了动物园,看到了马,然后爸爸告诉他,这就是马;之后,又看到了老虎,告诉他:“看,这种身上有条纹的动物就是老虎。”;最后,又带他去看了熊猫,对他说:“你看这熊猫是黑白色的。”然后,爸爸给小暗安排了一个任务,让他在动物园里找一种他从没见过的动物,叫斑马,并告诉了小暗有关于斑马的信息:“斑马有着马的轮廓,身上有像老虎一样的条纹,而且它像熊猫一样是黑白色的。”最后,小暗根据爸爸的提示,在动物园里找到了斑马(意料之中的结局。。。)。

上述例子中包含了一个人类的推理过程,就是利用过去的知识(马、老虎、熊猫和斑马的描述),在脑海中推理出新对象的具体形态,从而能对新对象进行辨认。Zero-shot learning就是希望能够模仿人类的这个推理过程,使得计算机具有识别新事物的能力。

2 One-shot learning

单样本学习,一种机器学习算法,它需要非常少的数据来识别或访问物体之间的相似性。单样本学习在深度学习模型中更有帮助。单样本学习中,机器学习算法仅需一个实例或不需要为每个类别提供大量样本来进行训练,最好的例子是计算机视觉图像和面部识别。

单样本学习的重要性和应用

  1. 单样本学习的目标是识别和认识物体的特征,类似于人类记住并训练系统利用先前知识分类新物体。
  2. 单样本学习在识别计算机视觉图像和面部识别、护照身份检查方面表现良好,个体应能准确分类不同的外貌。
  3. 单样本学习的一种方法是使用Siamese网络。
  4. 单样本学习应用于语音克隆、物联网分析、数学中的曲线拟合、单样本药物发现及其他医疗应用。

Zero-shot learning 指的是我们之前没有这个类别的训练样本。但是我们可以学习到一个映射X->Y。如果这个映射足够好的话,我们就可以处理没有看到的类了。

One-shot learning 指的是我们在训练样本很少,甚至只有一个的情况下,依旧能做预测。这是如何做到呢?可以在一个大数据集上学到general knowledge(具体的说,也可以是X->Y的映射),然后再到小数据上有技巧的update。

2.1 One-Shot Learning的意义

① 减少训练数据

深度学习需要大量的数据。如MNIST为了10个类别的区分,需要60000张训练图像,平均一个类别需要6000张训练图像。

One-Shot试图将一个类别的训练图像减少,极端情况时只有一张图片。

② 在新类别的数据出现时,无需重新训练

传统的神经网络无法处理没有出现在训练集中的类别。

如以员工刷脸打卡为例,使用深度神经网络,每一个新员工入职,都是一个类别,需要重新训练深度神经网络。如果每天都有新员工入职,每天都要重新训练网络,成本非常高。

One-Shot Learning可以无需重新训练即可应用于新的类别的数据。

One-shot learning 属于Few-shot learning的一种特殊情况。

3 Few-shot learning

小样本学习。少样本学习指的是用非常少的数据来训练模型,与需要大量数据的做法相反。少样本学习是元学习的一个典范,其中模型在元训练阶段被训练在若干相关任务上,因此它可以在仅有极少样本的情况下很好地泛化到未见过的数据。

如果训练集中,不同类别的样本只有少量,则称为Few-shot learning.

就是给模型待预测类别的少量样本,然后让模型通过查看该类别的其他样本来预测该类别。比如:给小孩子看一张熊猫的照片,那么小孩子到动物园看见熊猫的照片之后,就可以识别出那是熊猫。

少样本学习的重要性

  1. 减少数据收集,因为少样本学习需要较少的数据来训练模型,从而减少数据收集成本和计算成本。
  2. 在监督或无监督机器学习工具没有足够数据进行预测时,少样本学习非常有用。
  3. 人类可以在看到几个例子后轻松分类不同的手写字符,而机器则需要大量数据进行训练。少样本学习测试计算机是否能像人类一样从几个例子中学习。
  4. 机器可以使用少样本学习学习罕见疾病。它们使用计算机视觉模型通过少量数据分类异常情况。

少样本学习的应用

  1. 计算机视觉:字符识别、图像分类及其他图像应用(如图像检索、手势识别)和视频应用。
  2. 自然语言处理:解析、翻译、短评的情感分类、用户意图分类、文本分类、情感分析。
  3. 机器人:视觉导航、连续控制、从少量示范中学习操作动作。
  4. 音频处理:跨语言语音转换、用户间语音转换。
  5. 其他:医疗应用、物联网应用、数学应用、材料科学应用。

4 少样本、单样本和零样本学习的区别

  • 当只有少量数据可用,并且需要仅使用现有少量数据来训练模型时,少样本学习非常有用。少样本学习可用于图像分类和面部识别领域。
  • 另一方面,单样本学习使用的数据比少样本学习更少,或只使用一个实例或例子,而不是庞大的数据库。单样本学习在识别任何身份证明中的人像时更有用。
  • 当没有可用于机器学习的训练数据时,算法仍需识别或分类物体,这种情况下零样本学习产生最佳结果。

Few-shot Learning V.S Zero-shot Learning

  • 小样本学习的目的是在有少量训练数据的情况下能获得准确分类测试样本的模型
  • 零样本学习的目的是预测训练数据集中没有出现过的类

零样本学习和小样本学习有很多共同的应用,如:

  • 图像分类 (image classification)
  • 语义分割 (semantic segmentation)
  • 图像生成 (image generation)
  • 目标检测 (object detection)
  • 自然语言处理 (natural language processing)

另外单样本学习 (one-shot learning) 经常会和零样本学习混在一起。单样本学习是小样本学习问题的一个特例,它的目的是从一个训练样本或图片中学习到有关物体类别的信息。单样本学习的一个例子是,智能手机中使用的人脸识别技术。

总结

现在我们对少样本、单样本和零样本学习有了一个大致的了解,尽管它们有一些缺点。

主要收获是:

  1. 我们可以在数据量较少的情况下使用这些算法,这样收集大量数据来训练模型所需的时间更少。
  2. 对于深度学习模型,少样本、单样本和零样本学习是最佳选择。
  3. 单样本学习消除了对数十亿张图像进行模型训练的数据需求。
  4. 这些学习广泛应用于分类、回归和图像识别。
  5. 所有这些技术都有助于克服数据稀缺挑战并降低成本。
目录
相关文章
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
17天前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
74 3
|
5天前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
126 64
|
16天前
|
人工智能 新制造 芯片
2024年中国AI大模型产业发展报告解读
2024年,中国AI大模型产业迎来蓬勃发展,成为科技和经济增长的新引擎。本文解读《2024年中国AI大模型产业发展报告》,探讨产业发展背景、现状、挑战与未来趋势。技术进步显著,应用广泛,但算力瓶颈、资源消耗和训练数据不足仍是主要挑战。未来,云侧与端侧模型分化、通用与专用模型并存、大模型开源和芯片技术升级将是主要发展方向。
|
11天前
|
人工智能 弹性计算 数据可视化
解决方案|触手可及,函数计算玩转 AI 大模型 评测
解决方案|触手可及,函数计算玩转 AI 大模型 评测
23 0
|
8天前
|
机器学习/深度学习 人工智能 算法
AI技术在医疗诊断中的应用及前景展望
本文旨在探讨人工智能(AI)技术在医疗诊断领域的应用现状、挑战与未来发展趋势。通过分析AI技术如何助力提高诊断准确率、缩短诊断时间以及降低医疗成本,揭示了其在现代医疗体系中的重要价值。同时,文章也指出了当前AI医疗面临的数据隐私、算法透明度等挑战,并对未来的发展方向进行了展望。
|
20天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
40 1
|
12天前
|
机器学习/深度学习 人工智能 算法
AI在医疗诊断中的应用
【10月更文挑战第42天】本文将探讨人工智能(AI)在医疗诊断中的应用,包括其优势、挑战和未来发展方向。我们将通过实例来说明AI如何改变医疗行业,提高诊断的准确性和效率。
|
13天前
|
存储 人工智能 搜索推荐
Memoripy:支持 AI 应用上下文感知的记忆管理 Python 库
Memoripy 是一个 Python 库,用于管理 AI 应用中的上下文感知记忆,支持短期和长期存储,兼容 OpenAI 和 Ollama API。
57 6
Memoripy:支持 AI 应用上下文感知的记忆管理 Python 库
|
8天前
|
机器学习/深度学习 人工智能 算法
强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用
本文探讨了强化学习在游戏AI中的应用,从基本原理、优势、应用场景到具体实现方法,以及Python在其中的作用,通过案例分析展示了其潜力,并讨论了面临的挑战及未来发展趋势。强化学习正为游戏AI带来新的可能性。
34 4