【大模型】大语言模型前沿技术系列讲座-学习笔记1:人工智能发展史

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 【大模型】大语言模型前沿技术系列讲座-学习笔记1:人工智能发展史

最近参加了深蓝学院举办的 《大型语言模型前沿技术系列分享》,该系列分享以大模型(LLM)为背景,以科普、启发为目的,从最基本的Transformer开始讲起,逐步涉及一些更高阶更深入的课题,涵盖大模型基础、大模型对齐、大模型推理和大模型应用等内容。

系列讲座的内容由浅入深,讲解非常细致,没有任何水分,很适合我这种NLP刚入门的小白,听了这些讲座之后感觉收获满满👍👍👍

8.26 讲座安排(实际时长17:30-21:30)

本篇博客记录第一个讲座:《人工智能发展史和ChatGPT初探》

1. 人工智能发展史

人工智能发展不是一帆风顺的。在早期,计算机视觉领域的发展是领先的,一个重要原因是斯坦福大学公开了lmageNet数据集,基于这个超大的数据集,研究人员提出了不同的模型,一个典型代表就是AlexNet.

相比于计算机视觉,自然语言处理领域的发展稍微滞后,这是由于处理对象(语言/文本)的特殊性,没有特定规律可循,研究人员针对此提出了RNN、LSTM、GRU等多种模型,但遇到了难以处理长文本,同时不利于并行训练的问题。

NLP的兴起 ⭐️

直到2017年Google提出了Transformer架构,并引入了自注意力机制,NLP的研究才进入了一个新的阶段。由于训练时间缩短,出现不少预训练模型,比如Bert和GPT,两者都是基于Transformer架构的,具体而言,Bert利用了Transformer的Encoder部分,GPT利用了Transformer的Decoder部分。

Bert采用了 双向 transformer的结构,它能看到前后的信息,而GPT采用了 单向 transformer的结构,它只能看到前面的信息。

由于结构上的区别,二者的应用也有所不同,Bert侧重于自然语言理解任务,而GPT更适用于自然语言生成任务。

原作者出现了!将会在后面的讲座分享!

多模态的出现 ⭐️

多模态-数据模态更为多元,包含图像、视频和文本等。

特征工程 > 深度学习(避免人为因素的干扰,但是需要大量的训练数据) > 预训练(大量数据预训练+少量数据微调) > 大模型

2. ChatGPT初探

基础技术—语言建模(Language Modeling)

用概率来度量一句话或者句子出现的概率(判断是人说的话的概率)

  • 符合特定语言规则或约定俗成的使用习惯的句子的概率更大
  • 概率分布跟语种相关

例如:P(我很喜欢吃苹果) > P(我吃苹果很喜欢),即句子“我很喜欢吃苹果”的出现概率比句子“我吃苹果很喜欢”的出现概率大。

预训练的目标即是最大化训练数据中所包含的所有句子的概率。基于链式我们可以把句子的概率拆成每个词的概率,然后把每个词的概率相乘即可。

相比于监督学习,自监督学习无需收集数据的标签。

GPT采用自回归,例如:输入“我很喜欢”,预测“吃苹果”;

而Bert属于掩码预训练模型,例如:去掉“吃”这个词,然后预测缺失的“吃”这个词。

GPT只能看到过去的信息,Bert可以看到全部的信息。

GPT的开发经过了多次迭代,参数量越来越庞大。

加入指令微调可以使模型与用户需求对齐。

指令微调的步骤:

1️⃣ 收集示例数据(人工完成),进行有监督的微调,形成基础模型

2️⃣ 为了让模型生成更符合人类偏好,对模型输出进行排序,训练奖励模型

3️⃣ 基于奖励模型,利用强化学习对基础模型进行微调

推理能力的提升

提示工程 ⭐️

提示工程(Prompting Engineering)定义:旨在引导和指导人工智能语言模型生成特定类型的输出。其通过设计和调整模型输入中的提示(prompt),以影响模型的行为和生成结果。提示工程的目标是通过精心构造的提示,引导模型更好地理解用户意图,并生成与之一致的回复,从而提高模型的可用性和准确性,使其更适应特定的应用场景和任务。提示工程是一个迭代的过程,需要进行实验和调整,以找到最佳的提示策略,可能涉及尝试不同的提示形式、修改关键词或短语的位置、添加额外的指令或约束条件等。通过不断改进和优化提示工程,可以改善语言模型的表现并满足特定需求。因此,提示工程在语言模型应用中具有重要意义。

两个常用技巧:In-Context LearningChain-of-Thought

In-Context Learning 提供一些示例。

比如给出一些评论以及态度,然后再给出一条评论时,可以根据示例预测态度。

Chain-of-Thought 清晰展现模型推理的中间过程。

比如对于鸡兔同笼问题,分步计算比直接计算的准确度更高。

GPT-3 & ChatGPT & GPT-4 已经展现出一定程度的智能,那智能从何而来?

智能来源 ⭐️

解释1:压缩

预训练的过程就是训练一个数据压缩器来对大量数据进行压缩,模型则学习一系列的压缩规则。在理想情况下,模型是一个无损的压缩器,对于新的数据进行压缩也是无损的,则说明这个模型具有较好的 泛化能力,即具有智能。

解释2:规模容量

解释3:预测/逻辑推理

总结 ⭐️

  • 通过自监督学习在大量无标签数据上进行预训练,训练目标为最大化下一个单词出现的概率;
  • 通过增大模型的参数量和训练数据量来提升基础模型的基本能力;
  • 融入代码数据进行预训练提升基础模型的推理能力;
  • 通过指令微调让基础模型与用户的需求对齐;
  • 基于人类反馈的强化学习(RLHF)则进一步让模型生成更加安全可靠的内容;
  • 大模型已经具备一定程度的智能。

注意事项:

  • 缺乏实时信息;
  • 缺乏常识推理;
  • 对偏见和歧视的反映;
  • 容易出现幻觉(hallucination),不可靠;
  • 缺乏判断力,可能给出不合适或不道德的建议。
相关文章
|
16天前
|
机器学习/深度学习 传感器 人工智能
AI与未来医疗:重塑健康管理新格局随着人工智能(AI)技术的飞速发展,医疗行业正迎来一场前所未有的变革。AI不仅在数据分析、诊断支持方面展现出巨大潜力,还在个性化治疗、远程医疗等多个领域实现了突破性进展。本文将探讨AI技术在医疗领域的具体应用及其对未来健康管理的影响。
人工智能(AI)正在彻底改变医疗行业的面貌。通过深度学习算法和大数据分析,AI能够迅速分析海量的医疗数据,提供精准的诊断和治疗建议。此外,AI在远程医疗、药物研发以及患者管理等方面也展现出了巨大的潜力。本文将详细探讨这些技术的应用实例,并展望其对健康管理的深远影响。
|
2月前
|
人工智能 监控 算法
智能时代的伦理困境:AI技术的道德边界探索人工智能在教育领域的革新之路未来编程:人工智能与代码共生的新篇章
【8月更文挑战第21天】在人工智能(AI)技术飞速发展的今天,我们正处在一个前所未有的科技变革时期。随着AI技术的深入人类生活的方方面面,它不仅带来了便利和效率的提升,同时也引发了关于道德和伦理的深刻讨论。本文将探讨AI技术发展中遇到的伦理挑战,以及如何建立合理的道德框架来指导AI的未来应用,确保技术进步与人类社会价值观的和谐共存。
229 61
|
9天前
|
机器学习/深度学习 人工智能 监控
人工智能与未来医疗:革命性技术的崛起##
本文探讨了人工智能在医疗领域的应用及其带来的变革。通过分析AI在疾病诊断、个性化治疗、药物研发和患者管理等方面的作用,揭示了这一技术如何提高医疗效率、降低成本并改善患者体验。文章还讨论了当前面临的挑战及未来发展的前景。 ##
|
10天前
|
机器学习/深度学习 人工智能 算法
探索人工智能技术在医疗领域的应用
随着科技的不断发展,人工智能(AI)技术在各个领域中的应用越来越广泛。本文将探讨人工智能在医疗领域的应用及其带来的变革,从医学影像分析到辅助诊断和个性化治疗方案的制定,通过案例分析展示其潜力与挑战,并展望未来的发展方向。
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
AI人工智能大模型的架构演进
随着深度学习的发展,AI大模型(Large Language Models, LLMs)在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进,包括从Transformer的提出到GPT、BERT、T5等模型的历史演变,并探讨这些模型的技术细节及其在现代人工智能中的核心作用。
66 9
|
17天前
|
机器学习/深度学习 存储 人工智能
深度学习中的模型压缩技术在人工智能领域,深度学习技术的迅猛发展带来了巨大的计算资源需求。为了解决这一问题,模型压缩技术应运而生。本文将介绍什么是模型压缩、常见的模型压缩方法以及其在实际应用中的意义。
随着深度学习技术的广泛应用,计算资源的需求也大幅增加。为减少资源消耗,提升模型效率,模型压缩技术成为研究热点。本文探讨了模型压缩的定义、主流方法和其重要性。通过量化、剪枝、知识蒸馏和轻量级架构等策略,模型得以在保持性能的同时减小体积,从而适用于资源受限的环境。这些技术不仅降低了计算成本,还推动了深度学习在移动设备和边缘计算等领域的应用,使AI技术更加普及和实用。总之,模型压缩在平衡模型性能与资源消耗之间发挥着关键作用,是未来AI发展的重要方向。
|
22天前
|
机器学习/深度学习 人工智能 监控
人工智能与未来医疗:革命性技术的崛起
人工智能在医疗领域正逐步展现出其巨大的潜力和革命性的影响力。本文将探讨AI在未来医疗中的应用,从诊断到治疗,以及其在医学影像、药物研发和个性化治疗中的作用。通过具体案例,我们揭示这些技术如何提升医疗效率、准确性和患者体验。同时,我们还将讨论AI带来的伦理和隐私挑战,并展望未来的发展方向。
|
26天前
|
机器学习/深度学习 人工智能 物联网
智能家居技术的未来:从自动化到人工智能
本文探讨了智能家居技术的发展趋势,从早期的自动化设备到现在的人工智能集成系统。文章首先介绍了智能家居的基本概念和历史发展,然后详细分析了当前智能家居技术的主要特点,包括物联网、机器学习和用户交互界面。接着,文章讨论了智能家居技术面临的挑战,如隐私保护、数据安全和技术标准化问题。最后,展望了未来智能家居技术的发展方向,包括更加智能化的家居管理、环境自适应能力和高级用户定制服务。文章旨在为读者提供一个关于智能家居技术发展的全面视角,并引发对未来生活方式的思考。
|
1月前
|
人工智能 运维 自然语言处理
AI战略丨构建未来: 生成式人工智能技术落地策略
GenAI 的技术落地需要企业进行周密地规划和持续地努力。企业必须从自身的战略出发, 综合考虑成本、效果和性能,制定合理的技术架构,通过全面的 AI 治理,实现可持续的创新和发展。
|
7天前
|
机器学习/深度学习 移动开发 TensorFlow
随着人工智能技术的迅速发展,图像识别在各个领域的应用越来越广泛
我们开发了一款基于Python和TensorFlow的果蔬识别系统,利用CNN模型高效识别12种常见果蔬,提升饮食健康与食材管理。该系统通过图像预处理与增强提高模型鲁棒性,并借助Django搭建Web平台,提供便捷的图片上传识别功能。项目不仅展示了深度学习在图像识别中的潜力,还为相关研究奠定了基础。更多详情及演示视频请访问:[项目链接](https://www.yuque.com/ziwu/yygu3z/pnrng41h0sg5f5tf)。
14 0

热门文章

最新文章

下一篇
无影云桌面