如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 如何基于Llama 2搭建自己的大模型?8月26日,4位技术大牛手把手教你

如果要问「2023 年最火的动物是什么?」AI 圈外的人可能会回答「熊猫」,并给你列出一长串熊猫的名字。而 AI  圈内的人八成会回答「羊驼」。而且,他们也能给你列出一长串「羊驼」的名字:llama、vicuna、alpaca……得益于 Meta Llama 模型的开源,AI 社区的研究者对生物学羊驼属的英文单词已经如数家珍,每个单词都对应着一个(或一组)基于 Llama 的微调模型。这些模型各有所长,在 Llama 的基础上提升了对话、多模态生成等能力,而且更符合人类对话习惯。不过,由于存在开源协议问题,第一版 Llama 一直不可以商用,这让一些想基于该模型构建应用的从业者持谨慎态度。

就在前几天,Meta 又开源了 Llama 2,性能更加接近 ChatGPT,而且允许商用(日活超过 7 亿需要单独申请)。这意味着未来更多人会加入 Llama 阵营,基于这一模型进行微调,并构建商业应用。有人预言说,大模型的安卓时代就要来了!

在这样一个激动人心的时刻,不少从业者已经摩拳擦掌,准备做出一些成果。不过,在此之前,每个人都需要先把 Llama 2 背后的技术吃透,同时了解其潜在的应用场景。这会让大家在之后的模型、应用构建之路上走得更顺。

为此,机器之心专门设计了「Llama 2 大模型算法与应用实践」论坛。

论坛邀请到上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人刘鹏飞,老刘说 NLP 技术公众号作者、开源爱好者刘焕勇,北京灵琐科技 CEO、Chinese Llama 2 7B 项目发起人史业民,前智源研究院技术总监苏洋等四位专家带来演讲及实战分享。

论坛为期 1 天,内容包括 Llama 2 算法解读、基于 Llama 2 开发中文大模型、Llama 2 案例解读和应用实践等。

通过本场系统分享,你将系统了解到 Llama 2 背后的技术以及潜在的应用场景,为即将到来的「大模型安卓时代」做好准备。

4 位资深主讲人,做过哪些相关工作?

主讲人:刘鹏飞,上海交通大学清源研究院长聘教轨副教授、生成式人工智能研究组(GAIR)负责人

个人简介:专注于自然语言的预训、生成和评估等研究方向;在自然语言处理和人工智能领域发表学术论文 60 余篇。谷歌学术引用 7000 余次。ACL 会议史上首次实现连续两年获得 System & Demo Paper Award;提示工程(Prompt Engineering)概念最早提出者之一。代表作包括:ExplainaBoard,高考英语 AI,LIMA 等工作。

Google Scholar:https://scholar.google.com/citations?hl=en&user=oIz_CYEAAAAJ

GitHub 个人主页:https://github.com/pfliu-nlp


主讲人:刘焕勇,老刘说 NLP 技术公众号作者、开源爱好者

个人简介:曾就职于中国科学院软件研究所。主要研究方向为领域知识/事件图谱的构建与应用,大模型的数据工程、知识库增强与自动化评估,申请发明专利十余项、论文数篇。近年来在 OGB-Wikikg 2、CCKS 多模态实体对齐、可解释类案匹配等评测中获得多项冠亚军。致力于自然语言处理技术开源共享,在 GitHub 开源项目 60+,收获 star 数超 2W+,创立「老刘说 NLP」技术公众号,具有广泛影响力。

GitHub 个人主页:https://liuhuanyong.github.io/

主讲人:史业民,北京灵琐科技 CEO、Chinese Llama 2 7B 项目发起人

个人简介:本科及博士毕业于北京大学,入选斯坦福大学发布的 2022 年度「全球前 2% 顶尖科学家榜单」,在人工智能领域顶会和学术期刊上发表论文 20 余篇;作为智源研究院 Z-lab 联合负责人,从事大模型相关算法研究与应用探索,参与了智源悟道 3.0 研发,是最大可商用中文指令数据集 COIG、COIG-PC 的发起者、组织者之一,也是音乐预训练大模型 MERT 的作者之一,曾获 CAMEO 蛋白质结构预测年度、季度、月度第一名。

GitHub 项目地址:https://github.com/LinkSoul-AI/Chinese-Llama-2-7b


主讲人:苏洋,前智源研究院技术总监

个人简介:Llama 2 中文开源模型社区贡献者。GitHub 社区活跃用户,国内首个 Llama 2 中文版开源社区贡献者,GitHub 热榜八十行代码实现类似 Midjourney 官方 Describe 开源工具作者,双卡 Finetune Llama 一代 65B 模型,早期 ChatGPT 应用 「hacker」,实现了 ChatGPT 自由接入数据源等工具。

GitHub 个人主页:https://github.com/soulteary

相关文章
|
数据可视化 测试技术 PyTorch
智谱ChatGLM3魔搭最佳实践教程来了!
ChatGLM3-6B 是 ChatGLM 系列最新一代的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上
|
机器学习/深度学习 人工智能 编解码
|
3月前
|
决策智能 开发者
手把手教你如何用AIGC大模型写一首歌
本文记录了作者用大模型创作歌曲及视频的全过程。
|
4月前
|
机器学习/深度学习 数据挖掘 PyTorch
🚀PyTorch实战宝典:从数据分析小白到深度学习高手的飞跃之旅
【7月更文挑战第29天】在数据驱动的世界里, **PyTorch** 作为深度学习框架新星, 凭借其直观易用性和高效计算性能, 助力数据分析新手成为深度学习专家。首先, 掌握Pandas、Matplotlib等工具进行数据处理和可视化至关重要。接着, 安装配置PyTorch环境, 学习张量、自动求导等概念。通过构建简单线性回归模型, 如定义 `nn.Module` 类、设置损失函数和优化器, 进行训练和测试, 逐步过渡到复杂模型如CNN和RNN的应用。不断实践, 你将能熟练运用PyTorch解决实际问题。
76 1
|
4月前
|
机器学习/深度学习 数据采集 人工智能
动手实践:从零开始训练AI模型的全面指南
【7月更文第14天】随着人工智能技术的飞速发展,训练AI模型已成为科研、工程乃至创业领域的热门技能。本文旨在为初学者提供一个清晰、实用的指南,带领大家从零开始,了解并实践如何训练一个人工智能模型。我们将以一个简单的线性回归任务为例,逐步深入,探讨数据预处理、模型构建、训练过程及评估方法,最后展示如何使用Python和深度学习库PyTorch实现这一过程。
2783 0
|
5月前
|
Web App开发 机器学习/深度学习 人工智能
详细解读AI测试之Applitools入门教程
详细解读AI测试之Applitools入门教程
102 0
|
6月前
|
机器学习/深度学习 Python
有没有一些开源的深度学习项目可以帮助我实践所学的知识?
【2月更文挑战第14天】【2月更文挑战第40篇】有没有一些开源的深度学习项目可以帮助我实践所学的知识?
39 1
|
人工智能 自然语言处理 数据安全/隐私保护
【玩转ModelScope有奖征文活动】全新中文大模型竞技场上手评测
近年来,人工智能领域取得了巨大的进展,其中中文自然语言处理(NLP)领域尤为突出。这一进展的关键因素之一是中文大型语言模型的崛起,如BERT、GPT-3和其后继者,等。为了评估这些模型的性能和效用,进行中文大模型评测变得至关重要。本文将深入探讨中文大模型评测的关键方面,方法和洞见。本次测试主要模型为ChatGLM,moss-moon-003-sft,BiLLa-7B-SFT和BELLE-LLaMA-13B-2M等
74060 32
【玩转ModelScope有奖征文活动】全新中文大模型竞技场上手评测
|
11月前
|
人工智能 搜索推荐 物联网
文生视频黑马AnimateDiff 魔搭社区最佳实践教程来啦!
近1个月来,AnimateDiff 无疑是AI动画/视频生成领域的一匹黑马,以“效果丝滑、稳定、无闪烁”等好评斩获“Stable Diffusion封神插件”称号。
|
机器学习/深度学习 数据采集 人工智能
从零开始构建自己的AI:一个初学者的机器学习教程
通过这个简单的机器学习教程,我们初步了解了从数据收集、选择模型到训练和预测的基本流程。机器学习是一个广阔的领域,有很多知识和技能需要深入学习。希望本教程能为初学者提供一个入门的指引,引导大家探索更多有关机器学习的知识。感谢您阅读本文,如果您有任何问题或想法,请在评论区与我分享!让我们一起踏上机器学习的旅程,构建属于自己的AI。
2273 1
从零开始构建自己的AI:一个初学者的机器学习教程