大模型学习路线与建议

简介: 大模型学习路线与建议


第一章 深度学习基础

深度学习基础

深度学习经典模型解析

深度学习模型优化策略解析

深度学习GPU原理与应用方法

深度学习GPU并行训练策略解析

深度学习模型多GPU训练实战

第二章 智能对话系统基础

智能对话系统综述

多轮对话系统架构解析

QA系统架构解析

知识图谱系统架构解析

KBQA系统架构解析

生成式对话系统架构解析

智能对话系统发展展望

知识图谱系统实战

第三章 大模型基础

大模型技术概述

GPT 系列模型核心原理详解(GPT1/GPT2/GPT3/GPT4/InstructGPT)

LLaMA 系列模型核心原理详解(LLaMA/Alpaca/Vicuna/BaiChuan/LLaMA2/BaiChuan2)

LLaMA 系列模型源码详解

BLOOM 系列模型核心原理详解(BLOOM/BLOOMZ)

ChatGLM 系列模型核心原理详(ChatGLM/ChatGLM2)

Langchain 框架核心原理详解

Langchain-LLM部署应用实战

第四章 大模型应用实践

大模型微调概述

大模型微调中的核心要素

大模型微调中的数据收集与评估

大模型微调中ChatGPT的使用

大模型Tuning技术详解(Prompt-Tuning/Instruction-Tuning/P-Tuning)

大模型PEFT技术详解(Adapter/LoRA)

大模型全参数微调技术详解(DeepSpeed)

大模型RLHF技术详解(PPO/DeepSpeed-Chat)

基于常规NLP任务的大模型微调实战

第五章 大模型实战项目

大模型训练环境搭建

大模型数据收集与 instruction 设计

通用大模型微调代码开发(支持多模型/多框架)

Baichuan-13B多GPU LoRA微调实现

Baichuan-13B多GPU 全参数微调实现

大模型性能评估体系搭建

大模型部署与服务接口开发

大模型界面化调用系统开发


目录
相关文章
|
机器学习/深度学习 人工智能 自然语言处理
四张图片道清AI大模型的发展史(1943-2023)
现在最火的莫过于GPT了,也就是大规模语言模型(LLM)。“LLM” 是 “Large Language Model”(大语言模型)的简称,通常用来指代具有巨大规模参数和复杂架构的自然语言处理模型,例如像 GPT-3(Generative Pre-trained Transformer 3)这样的模型。这些模型在处理文本和语言任务方面表现出色,但其庞大的参数量和计算需求使得它们被称为大模型。当然也有一些自动生成图片的模型,但是影响力就不如GPT这么大了。
4863 0
|
机器学习/深度学习 算法 算法框架/工具
深度学习小白学习路线规划
深度学习小白学习路线规划
|
4月前
|
人工智能 弹性计算 自然语言处理
Bolt.diy:AI全栈开发,一句话生成网站
Bolt.diy是一个AI驱动的Web开发工具,支持通过自然语言Prompt直接生成、编辑和部署全栈应用,无需本地环境配置。本次实验基于DeepSeek于2025年5月28日发布了DeepSeek-R1-0528升级版本,显著提升了编程能力。
Bolt.diy:AI全栈开发,一句话生成网站
|
4月前
|
存储 人工智能 移动开发
AppFlow —— 给您的网站或企微添加AI助手
AppFlow AI助手提供灵活配置,助您轻松实现AI工具的Web页面访问与多种集成方式(H5页面、悬浮框等)。支持自定义页面生成及样式调整,满足个性化需求。文中详细介绍了创建AI助手、模型配置、Web页面集成等步骤,并展示不同场景下的使用效果。此外,还提供了企业微信集成、模型管理和插件扩展等相关操作指引,助力高效利用AI助手提升工作体验。
481 15
AppFlow —— 给您的网站或企微添加AI助手
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
AI大模型学习
本文概述了AI大模型学习的五个主要方向:理论基础、训练与优化、特定领域应用、伦理与社会影响,以及未来发展趋势与挑战。
369 1
|
机器学习/深度学习 人工智能 自然语言处理
LLM 大模型学习必知必会系列(一):大模型基础知识篇
LLM 大模型学习必知必会系列(一):大模型基础知识篇
LLM 大模型学习必知必会系列(一):大模型基础知识篇
|
10月前
|
数据可视化 安全 IDE
快速部署Langflow构建低代码应用
本文介绍了Langflow的基本信息,并通过阿里云计算巢完成了Langflow的快速部署,使用者不需要自己下载代码,不需要自己安装复杂的依赖,不需要了解底层技术,只需要在控制台图形界面点击几下鼠标就可以快速部署并启动Langflow,非技术同学也能轻松搞定。
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
Transformer图解以及相关的概念
【10月更文挑战第5天】transformer是目前NLP甚至是整个深度学习领域不能不提到的框架,同时大部分LLM也是使用其进行训练生成模型,所以transformer几乎是目前每一个机器人开发者或者人工智能开发者不能越过的一个框架。
255 4
|
存储 关系型数据库 MySQL
深入探究MySQL临键锁
临键锁(Next-Key Lock):临键锁是查询时InnoDB根据查询的条件而锁定的一个范围,这个范围中包含有间隙锁和记录数;临键锁=间隙锁+记录锁。 其设计的目的是为了解决Phantom Problem(幻读);主要是阻塞insert,但由于临键锁中包含有记录锁,因此临键锁所锁定的范围内如果包含有记录,那么也会给这些记录添加记录锁,从而造成阻塞除insert之外的操作;
3002 1
最通俗易懂的 JAVA slf4j,log4j,log4j2,logback 关系与区别以及完整集成案例
最通俗易懂的 JAVA slf4j,log4j,log4j2,logback 关系与区别以及完整集成案例
最通俗易懂的 JAVA slf4j,log4j,log4j2,logback 关系与区别以及完整集成案例