如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你

如果要问「2023 年最火的动物是什么?」AI 圈外的人可能会回答「熊猫」,并给你列出一长串熊猫的名字。而 AI  圈内的人八成会回答「羊驼」。而且,他们也能给你列出一长串「羊驼」的名字:llama、vicuna、alpaca……得益于 Meta Llama 模型的开源,AI 社区的研究者对生物学羊驼属的英文单词已经如数家珍,每个单词都对应着一个(或一组)基于 Llama 的微调模型。这些模型各有所长,在 Llama 的基础上提升了对话、多模态生成等能力,而且更符合人类对话习惯。不过,由于存在开源协议问题,第一版 Llama 一直不可以商用,这让一些想基于该模型构建应用的从业者持谨慎态度。

就在前几天,Meta 又开源了 Llama 2,性能更加接近 ChatGPT,而且允许商用(日活超过 7 亿需要单独申请)。这意味着未来更多人会加入 Llama 阵营,基于这一模型进行微调,并构建商业应用。有人预言说,大模型的安卓时代就要来了!

在这样一个激动人心的时刻,不少从业者已经摩拳擦掌,准备做出一些成果。不过,在此之前,每个人都需要先把 Llama 2 背后的技术吃透,同时了解其潜在的应用场景。这会让大家在之后的模型、应用构建之路上走得更顺。

为此,机器之心专门设计了「Llama 2 大模型算法与应用实践」论坛。

论坛邀请到上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人刘鹏飞,老刘说 NLP 技术公众号作者、开源爱好者刘焕勇,北京灵琐科技 CEO、Chinese Llama 2 7B 项目发起人史业民,前智源研究院技术总监苏洋等四位专家带来演讲及实战分享。

论坛为期 1 天,内容包括 Llama 2 算法解读、基于 Llama 2 开发中文大模型、Llama 2 案例解读和应用实践等。

通过本场系统分享,你将系统了解到 Llama 2 背后的技术以及潜在的应用场景,为即将到来的「大模型安卓时代」做好准备。

4 位资深主讲人,做过哪些相关工作?

主讲人:刘鹏飞,上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人

个人简介:专注于自然语言的预训、生成和评估等研究方向;在自然语言处理和人工智能领域发表学术论文 60 余篇。谷歌学术引用 7000 余次。ACL 会议史上首次实现连续两年获得 System & Demo Paper Award;提示工程(Prompt Engineering)概念最早提出者之一。代表作包括:ExplainaBoard,高考英语 AI,LIMA 等工作。

Google Scholar:https://scholar.google.com/citations?hl=en&user=oIz_CYEAAAAJ

GitHub 个人主页:https://github.com/pfliu-nlp


主讲人:刘焕勇,老刘说 NLP 技术公众号作者、开源爱好者

个人简介:曾就职于中国科学院软件研究所。主要研究方向为领域知识/事件图谱的构建与应用,大模型的数据工程、知识库增强与自动化评估,申请发明专利十余项、论文数篇。近年来在 OGB-Wikikg 2、CCKS 多模态实体对齐、可解释类案匹配等评测中获得多项冠亚军。致力于自然语言处理技术开源共享,在 GitHub 开源项目 60+,收获 star 数超 2W+,创立「老刘说 NLP」技术公众号,具有广泛影响力。

GitHub 个人主页:https://liuhuanyong.github.io/

主讲人:史业民,北京灵琐科技 CEO、Chinese Llama 2 7B 项目发起人

个人简介:本科及博士毕业于北京大学,入选斯坦福大学发布的 2022 年度「全球前 2% 顶尖科学家榜单」,在人工智能领域顶会和学术期刊上发表论文 20 余篇;作为智源研究院 Z-lab 联合负责人,从事大模型相关算法研究与应用探索,参与了智源悟道 3.0 研发,是最大可商用中文指令数据集 COIG、COIG-PC 的发起者、组织者之一,也是音乐预训练大模型 MERT 的作者之一,曾获 CAMEO 蛋白质结构预测年度、季度、月度第一名。

GitHub 项目地址:https://github.com/LinkSoul-AI/Chinese-Llama-2-7b


主讲人:苏洋,前智源研究院技术总监

个人简介:Llama 2 中文开源模型社区贡献者。GitHub 社区活跃用户,国内首个 Llama 2 中文版开源社区贡献者,GitHub 热榜八十行代码实现类似 Midjourney 官方 Describe 开源工具作者,双卡 Finetune Llama 一代 65B 模型,早期 ChatGPT 应用 「hacker」,实现了 ChatGPT 自由接入数据源等工具。

GitHub 个人主页:https://github.com/soulteary

相关文章
|
3月前
|
机器学习/深度学习 人工智能 TensorFlow
🔥零基础逆袭!Python数据分析+机器学习:TensorFlow带你秒变AI大师
【7月更文挑战第29天】在这个数据驱动的时代,掌握Python与机器学习技能是进入AI领域的关键。即使从零开始,也能通过TensorFlow成为AI专家。
58 8
|
3月前
|
机器学习/深度学习 数据挖掘 PyTorch
🚀PyTorch实战宝典:从数据分析小白到深度学习高手的飞跃之旅
【7月更文挑战第29天】在数据驱动的世界里, **PyTorch** 作为深度学习框架新星, 凭借其直观易用性和高效计算性能, 助力数据分析新手成为深度学习专家。首先, 掌握Pandas、Matplotlib等工具进行数据处理和可视化至关重要。接着, 安装配置PyTorch环境, 学习张量、自动求导等概念。通过构建简单线性回归模型, 如定义 `nn.Module` 类、设置损失函数和优化器, 进行训练和测试, 逐步过渡到复杂模型如CNN和RNN的应用。不断实践, 你将能熟练运用PyTorch解决实际问题。
61 1
|
3月前
|
机器学习/深度学习 数据采集 人工智能
动手实践:从零开始训练AI模型的全面指南
【7月更文第14天】随着人工智能技术的飞速发展,训练AI模型已成为科研、工程乃至创业领域的热门技能。本文旨在为初学者提供一个清晰、实用的指南,带领大家从零开始,了解并实践如何训练一个人工智能模型。我们将以一个简单的线性回归任务为例,逐步深入,探讨数据预处理、模型构建、训练过程及评估方法,最后展示如何使用Python和深度学习库PyTorch实现这一过程。
2377 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
从零开始学习深度学习:入门指南与实践建议
本文将引导读者进入深度学习领域的大门,从基础概念到实际应用,为初学者提供全面的学习指南和实践建议。通过系统化的学习路径规划和案例实践,帮助读者快速掌握深度学习的核心知识和技能,迈出在人工智能领域的第一步。
253 10
|
5月前
|
机器学习/深度学习 Python
有没有一些开源的深度学习项目可以帮助我实践所学的知识?
【2月更文挑战第14天】【2月更文挑战第40篇】有没有一些开源的深度学习项目可以帮助我实践所学的知识?
39 1
|
机器学习/深度学习 数据采集 人工智能
从零开始构建自己的AI:一个初学者的机器学习教程
通过这个简单的机器学习教程,我们初步了解了从数据收集、选择模型到训练和预测的基本流程。机器学习是一个广阔的领域,有很多知识和技能需要深入学习。希望本教程能为初学者提供一个入门的指引,引导大家探索更多有关机器学习的知识。感谢您阅读本文,如果您有任何问题或想法,请在评论区与我分享!让我们一起踏上机器学习的旅程,构建属于自己的AI。
2054 1
从零开始构建自己的AI:一个初学者的机器学习教程
|
11月前
|
机器学习/深度学习 存储 Cloud Native
【推荐】最适合新手的5个深度学习实战项目
【推荐】最适合新手的5个深度学习实战项目
|
人工智能 TensorFlow 算法框架/工具
AI工程师面试知识点:TensorFlow 框架
AI工程师面试知识点:TensorFlow 框架
AI工程师面试知识点:TensorFlow 框架
|
机器学习/深度学习 人工智能 数据挖掘
李沐《动手学深度学习》PyTorch 实现版开源,瞬间登上 GitHub 热榜!
李沐《动手学深度学习》PyTorch 实现版开源,瞬间登上 GitHub 热榜!
2083 0
李沐《动手学深度学习》PyTorch 实现版开源,瞬间登上 GitHub 热榜!
|
机器学习/深度学习
重磅!深度学习圣经“花书”核心笔记、代码发布
重磅!深度学习圣经“花书”核心笔记、代码发布
830 0
重磅!深度学习圣经“花书”核心笔记、代码发布