包含用于生成指令调优数据集集合的代码。第一个是原始的 Flan 2021，记录在 Finetuned Language Models are Zero-Shot Learners 中；第二个是扩展版本，被称为 Flan Collection，记录在 The Flan Collection: Designing Data and Methods for Effective Instruction Tuning 中，用于生成 Flan-T5 和 Flan-PaLM。

❤️GitHub: https://github.com/google-research/FLAN

以下是基于 FLAN 项目的衍生模型或类似模型：

Flan-Alpaca
Flan-UL2

Flan-Alpaca

来自人类和机器的指令调优。包含用于将 Stanford Alpaca 合成指令调优扩展到现有指令调优模型（例如 Flan-T5）的代码。 HuggingFace 上提供了预训练模型和演示。

❤️GitHub: https://github.com/declare-lab/flan-alpaca

Flan-UL2

Flan-UL2是基于T5架构的编解码器模型。它使用与去年早些时候发布的 UL2 模型相同的配置。使用“Flan”提示调整和数据集收集对其进行了微调。

❤️Hugging Face: google/flan-ul2 · Hugging Face
🎬视频: Trying Out Flan 20B with UL2 — Working in Colab with 8Bit Inference — YouTube

GLM (General Language Model)

GLM 是一种使用自回归填空目标进行预训练的通用语言模型，可以针对各种自然语言理解和生成任务进行微调。

以下是基于 GLM 项目的衍生模型或类似模型：

GLM-130B
ChatGLM-6B

GLM-130B

GLM-130B是一个开放的双语（英汉）双向密集模型，拥有1300亿个参数，使用通用语言模型（GLM）的算法进行预训练。它旨在在单台A100（40G 8）或V100（32G 8）服务器上用具有130B参数模型进行推理任务。通过 INT4 量化，硬件要求可以进一步降低到具有 4 * RTX 3090（24G）的单个服务器，而性能几乎没有下降。截至 2022 年 7 月 3 日，GLM-130B 已经接受了超过 4000 亿个文本标记的训练（中文和英文各 200B）。

❤️GitHub: https://github.com/THUDM/GLM-130B

ChatGLM-6B

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。 ChatGLM-6B 使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

🏠官网: ChatGLM
❤️GitHub: https://github.com/THUDM/ChatGLM-6B

GPT-J (EleutherAI)

GPT-J 是 EleutherAI 开发的开源人工智能语言模型。GPT-J 在各种零样本下游任务上的表现与 OpenAI 的 GPT-3 非常相似，甚至在代码生成任务上的表现优于它。

最新版本 GPT-J-6B 是一种基于名为 The Pile) 的数据集的语言模型。The Pile 是一个开源的 825 GB 语言建模数据集，分为 22 个较小的数据集。GPT-J 在能力上与 ChatGPT 类似，虽然它不具有聊天机器人的功能，仅作为文本预测器。

❤️GitHub: https://github.com/kingoflolz/mesh-transformer-jax/#gpt-j-6b
💻Demo: https://6b.eleuther.ai/

以下是基于 GPT-J 项目的衍生模型或类似模型：

Dolly

Dolly (Databricks)

Databricks 的 Dolly 是一个在 Databricks 机器学习平台上训练的大型语言模型，它基于开源模型 (GPT-J) 在对 50k的重点语料库(Stanford Alpaca)进行仅 30 分钟的微调，就表现出令人惊讶的高质量指令遵循行为。我们认为这一发现很重要，因为它表明创造强大的人工智能技术的能力比以前意识到的要容易得多。

❤️GitHub: https://github.com/databrickslabs/dolly
🎬视频: Meet Dolly the new Alpaca model — YouTube

Cerebras-GPT (Cerebras)

一系列开源、高效的大型语言模型。 Cerebras 开源了七个 GPT-3 模型，参数从 1.11 亿到 130 亿。这些模型使用 Chinchilla 公式进行训练，为准确性和计算效率设定了新的基准。

🏠官网: Cerebras-GPT: A Family of Open, Compute-efficient, Large Language Models — Cerebras
❤️Hugging Face: cerebras (Cerebras) (huggingface.co)
🎬视频: Checking out the Cerebras-GPT family of models — YouTube

GPT-NeoX

该项目记录了 EleutherAI 用于在 GPU 上训练大规模语言模型的库。当前的框架基于 NVIDIA 的 Megatron 语言模型，并通过 DeepSpeed 技术以及一些新颖的优化得到了增强。目标是使这个项目成为一个可访问的集散地，以收集训练大规模自回归语言模型的技术，并加速对大规模训练的研究。

❤️GitHub: https://github.com/EleutherAI/gpt-neox

HuggingGPT

HuggingGPT 是一个协作系统，由作为控制器的 LLM 和作为协作执行者的众多专家模型组成（来自 HuggingFace Hub）。

❤️GitHub: https://github.com/microsoft/JARVIS
📑论文: https://arxiv.org/abs/2303.17580

Polyglot

多语言均衡能力的大型语言模型。由于对当前多语言模型的非英语性能不满意，Polyglot团队制作了非英语语言性能更高的多语言模型，并将其命名为“Polyglot”。

❤️GitHub: https://github.com/EleutherAI/polyglot

Pythia

跨时间和尺度解释自回归Transformer

❤️GitHub: https://github.com/EleutherAI/pythia

Segment Anything

Segment Anything Model (SAM) 根据输入提示（例如点或框）生成高质量的对象掩码，它可用于为图像中的所有对象生成掩码。它已经在 1100 万张图像和 11 亿个掩码的数据集上进行了训练，并且在各种分割任务上具有很强的零样本性能。

The RWKV Language Model

RWKV：具有 Transformer 级 LLM 性能的可并行化 RNN（RWKV来自Transformer的4 个主要参数：R W K V）

❤️GitHub: https://github.com/BlinkDL/RWKV-LM/RWKV-LM
❤️ChatRWKV: https://github.com/BlinkDL/ChatRWKV
💻Hugging Face Demo: HuggingFace Gradio demo (14B ctx8192)
💻Hugging Face Demo: Raven (7B finetuned on Alpaca) Demo
🎬视频: Raven — RWKV-7B RNN’s LLM Strikes Back — YouTube

XGLM

XGLM 模型是 Few-shot Learning with Multilingual Language Models 中提出的模型。

❤️GitHub: https://github.com/facebookresearch/fairseq/tree/main/examples/xglm
❤️Hugging Face: https://huggingface.co/docs/transformers/model_doc/xglm

开源大语言模型(LLM)汇总

开源大语言模型(LLM)汇总

Alpaca (Stanford)

Alpaca.cpp

Alpaca-LoRA

Baize

Cabrita

BELLE

Luotuo

Vicuna (FastChat)

Chinese-Vicuna

GPT4All

Koala

llama.cpp

Lit-LLaMA ️

BLOOM (BigScience)

BLOOM-LoRA

Petals

Flamingo (Google/Deepmind)

Flamingo — Pytorch

OpenFlamingo

FLAN (Google)

Flan-Alpaca

Flan-UL2

GLM (General Language Model)

GLM-130B

ChatGLM-6B

GPT-J (EleutherAI)

Dolly (Databricks)

Cerebras-GPT (Cerebras)

GPT-NeoX

HuggingGPT

Polyglot

Pythia

Segment Anything

The RWKV Language Model

XGLM

ModelScope模型即服务

热门文章

最新文章

相关电子书

相关实验场景