ChatGPT最强专业学习资料集锦

简介: 本文旨在整理一份可供参考和学习的专业ChatGPT相关资料,包括ChatGPT相关论文、Github项目、以及当前市场上出现的ChatGPT相关产品等。

大模型学习课程或教程

名称

介绍

课程或教程地址

发布或发表时间

The Transformer Family Version 2.0

大模型家族详细介绍

The Transformer Family Version 2.0 | Lil'Log (lilianweng.github.io)

2023-01-27

TensorFlow学习教程

Google官方TensorFlow学习教程,可以直接通过Google colab实验室运行教程中的代码

初学者的 TensorFlow 2.0 教程  |  TensorFlow Core

2022-09-21

斯坦福大模型课程CS324

CS324提供了关于大型语言模型建模、理论、伦理和系统方面的基础知识,并且提供了亲自体验构建大模型的机会。

Home | CS324 (stanford-cs324.github.io)

2021-12-24

伯克利STAT 157深度学习课程

这个课程提供了深度学习的实用介绍,包括理论动机以及如何在实践中实现。

Syllabus — STAT 157, Spring 19 documentation (d2l.ai)

2019-02

The Illustrated Transformer

“Transformer”概念通俗易懂介绍

The Illustrated Transformer – Jay Alammar – Visualizing machine learning one concept at a time. (jalammar.github.io)

2018-06-27

 



大模型项目



模型名称

介绍

介绍地址

发布时间

Vicuna-13B

一个开源的聊天机器人,通过在从ShareGPT收集的用户共享对话上进行LLaMA微调来训练。使用GPT-4作为评判标准的初步评估显示,Vicuna-13B在超过90*的情况下实现了OpenAI ChatGPTGoogle Bard的质量,并且在超过90* 的情况下优于其他模型(如LLaMAStanford Alpaca)。训练Vicuna-13B的成本约为300美元。训练和服务代码以及在线演示可供非商业用途公开使用。

Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality | by the Team with members from UC Berkeley, CMU, Stanford, and UC San Diego (lmsys.org)

2023-03-19

LangChain

一个用于开发由语言模型驱动的应用程序的框架

https://docs.langchain.com/docs

https://github.com/hwchase17/langchain

2023-03-24

LMFlow

一个可扩展、方便、高效的工具箱,用于微调大型机器学习模型,旨在用户友好、快速可靠,并且对整个社区开放。

https://lmflow.com/

2023-03-27

Chatbot Arena

一个基于大型语言模型(LLMs)的基准平台,在发布博客文章中,给出了一个基于Elo评分系统的排行榜

https://lmsys.org/blog/2023-05-03-arena/

2023-05-03

ImageBind

第一个能够同时绑定六种模态数据的AI模型,无需明确监督。通过识别这些模态之间的关系——图像和视频、音频、文本、深度、热量和惯性测量单元(IMUs——这一突破有助于推进人工智能,使机器能够更好地分析许多不同形式的信息。

https://imagebind.metademolab.com/

2023-05-09

 



ChatGPT相关大模型论文合集

论文分类

名称

论文链接

发表时间

时间为预印网站最新时间

Transformer

Transformer 论文

Attention Is All You Need

2017-12-05

Transformer 模型介绍和分类

Transformer models: an introduction and catalog

2023-02-16

OpenAI

DALL E 论文

Zero-Shot Text-to-Image Generation

2021-02-26

DALL E 2论文

Hierarchical Text-Conditional Image Generation with CLIP Latents

2022-04-12

Codex 论文

Evaluating Large Language Models Trained on Code

2021-07-14

GPT-1

Improving Language Understanding by Generative Pre-Training

2018-06

GPT-2

Language Models are Unsupervised Multitask Learners

2019-02

GPT-3

Language Models are Few-Shot Learners

2020-07-22

InstructGPT

Training language models to follow instructions with human feedback

2022-03-04

GPT-4

GPT-4 Technical Report

2023-03-27

GPT对美国劳动力市场影响研究论文

[2303.10130] GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models (arxiv.org)

2023-03-23

语言模型可以解释语言模型中的神经元

Language models can explain neurons in language models (windows.net)

2023-05-09

开源GPT替代模型

BLOOM1760亿参数的仅解码器Transformer语言模型

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

2023-03-13

开放预训练Transformer语言模型

OPT: Open Pre-trained Transformer Language Models

2022-06-21

Chain of Thought

Chain of Thought论文

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

2023-01-10

语言模型中的多模态思维链推理

Multimodal Chain-of-Thought Reasoning in Language Models

2023-02-16

ViLT

ViLT论文

ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision

2021-06-10

HELM

HELM全面语言模型评测论文

Holistic Evaluation of Language Models

2022-11-16

GPT模型分析

复旦大学GPT模型对比分析

A Comprehensive Capability Analysis of GPT-3 and GPT-3.5 Series Models

2023-03-18

微软研究院GPT-4早期实验

Sparks of Artificial General Intelligence: Early experiments with GPT-4

2023-03-27

AIGC完整调查,ChatGPTGPT-4GPT-5是你所需要的全部吗?

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

2023-03-21

Anthropic

Anthropic LLM论文

Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback

2022-04-12

LaMda

LaMda模型论文

LaMDA: Language Models for Dialog Applications

2022-02-10

GLM

GLM论文

GLM: General Language Model Pretraining with Autoregressive Blank Infilling

2022-03-17

GLM-130B

GLM-130B: An Open Bilingual Pre-trained Model

2022-10-05

Toolformer

Toolformer模型论文

Toolformer: Language Models Can Teach Themselves to Use Tools

2023-02-09

GPT-4应用分析

GPT-4在医学挑战问题上的能力

Capabilities of GPT-4 on Medical Challenge Problems

2023-03-20

人工缪斯:生成式人工智能聊天机器人已经达到了与人类相当的创造力水平

Artificial muses: Generative Artificial Intelligence Chatbots Have Risen to Human-Level Creativity

2023-03-21

心灵与机器相遇:揭开GPT-4的认知心理学

Mind meets machine: Unravelling GPT-4's cognitive psychology

2023-03-20

CodeGeeX

CodeGeeX,一个具有130亿参数的多语言代码生成模型。截至20226月,CodeGeeX已经在23种编程语言的8500亿个标记上进行了预训练。广泛的实验表明,在HumanEval-X上,CodeGeeX在代码生成和翻译任务方面都优于规模相似的多语言代码模型。

CodeGeeX: A Pre-Trained Model for Code Generation with Multilingual Evaluations on HumanEval-X

2023-03-30

BloombergGPT

基于广泛的金融数据进行训练的500亿参数语言模型,拥有一个3630亿令牌数据集,基于彭博社广泛的数据来源,可能是迄今为止最大规模的特定领域数据集,并增加了来自通用目标数据集的3450亿令牌。通过标准LLM基准测试、开放式金融基准测试以及一套最能反映彭博社预期使用方式的内部基准测试验证了BloombergGPT。通过混合数据集训练得到了一个性能优异且不损失通用LLM基准表现水平但在金融任务上超越现有模型很多倍的模型。

BloombergGPT: A Large Language Model for Finance

2023-03-30

HuggingGPT

HuggingGPT是一个协作系统,由LLM作为控制器和许多专家模型作为协作执行者(来自HuggingFace Hub)组成。系统工作流程包括四个阶段:

1.

任务规划:使用ChatGPT分析用户请求以理解其意图,并将其分解为可能可解决的任务。

2.

模型选择:为了解决计划中的任务,ChatGPT基于它们的描述选择托管在Hugging Face上的专家模型。

3.

任务执行:调用并执行每个选定的模型,并将结果返回给ChatGPT

4.

响应生成:最后,使用ChatGPT集成所有模型的预测,并生成响应。

HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Face

2023-04-01

ImageBind

一种学习跨越六种不同模态的联合嵌入的方法——图像、文本、音频、深度、热和IMU数据。ImageBind可以利用最近大规模视觉语言模型,并通过使用它们与图像自然匹配来扩展其零样本能力到新的模态上。

https://arxiv.org/pdf/2305.05665

2023-05-09


OpenAI参考资料集锦

功能

地址

OpenAI 官方Prompt调试

https://platform.openai.com/playground?mode=chat

OpenAI 官方文档

https://platform.openai.com/docs/introduction

OpenAI API文档

https://platform.openai.com/docs/api-reference

OpenAI 官方Prompts示例

https://platform.openai.com/examples

OpenAI 官方论文合集

https://openai.com/research

OpenAI 产品介绍

https://openai.com/product

OpenAI 模型使用价格说明

https://openai.com/pricing

OpenAI 插件API说明

https://platform.openai.com/docs/plugins/introduction

 

ChatGPT相关Github项目

ChatGPT模型相关Github项目

模型名称

简介

项目地址

发布时间

GLM

清华知识工程和数据挖掘组开源的一个通用语言模型,使用自回归填空目标进行预训练,并可以在各种自然语言理解和生成任务上进行微调。

https://github.com/THUDM/GLM

2022-03-17

GLM-130B

清华知识工程和数据挖掘组开源的一个开放的双语(英文和中文)双向稠密模型,具有1300亿个参数,使用通用语言模型(GLM)算法进行预训练。

https://github.com/THUDM/GLM-130B

2022-10-05

ChatGLM-6B

清华知识工程和数据挖掘组开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。

https://github.com/THUDM/ChatGLM-6B

2023-03

LLaMA

Facebook开源的用于加载LLaMAarXiv)模型并运行推理的代码。

https://github.com/facebookresearch/llama

2023-02

Alpaca

斯坦福开源的Alpaca 7B模型,一个在52K个指令跟随演示中从LLaMA 7B模型微调而来的模型。在对单轮指令跟随的初步评估中,Alpaca表现出与OpenAItext-davinci-003相似的定性特征,同时其体积小、易于复制且成本低廉。

https://github.com/tatsu-lab/stanford_alpaca

2023-03-13

OpenAI Evals

OpenAI开源的ChatGPT相关模型的评测工具

https://github.com/openai/evals

2023-03

Visual ChatGPT

微软开源的视觉ChatGPT,连接了ChatGPT和一系列视觉基础模型,使得在聊天过程中可以发送和接收图片。

GitHub - microsoft/visual-chatgpt: Official repo for the paper: Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

2023-03-08

Dolly

DatabricksDolly是一个大型语言模型,它在Databricks机器学习平台上进行了训练。研究表明,当这个两年前的开源模型(GPT-J)仅经过30分钟的精细调整,并针对50,000条记录(斯坦福Alpaca)进行专注语料库训练时,其展现出惊人高质量的指令跟随行为,而这种行为并不是基于该模型构建的基础模型所具有的特征。我们认为这一发现非常重要,因为它证明了创造强大人工智能技术的能力比以前意识到的要容易得多。

https://github.com/databrickslabs/dolly

2023-03-24

gpt4all

gpt4all:一个聊天机器人,它是在包括代码、故事和对话等大量干净的助手数据集上进行训练的。

https://github.com/nomic-ai/gpt4all

2023-03

CodeGeeX

CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型。CodeGeeX采用华为MindSpore框架实现,在鹏城实验室鹏城云脑II”中的192个节点(共1536个国产昇腾910 AI处理器)上训练而成。截至2022622日,CodeGeeX历时两个月在20多种编程语言的代码语料库(>8500亿Token)上预训练得到。CodeGeeX有以下特点:

高精度代码生成:支持生成PythonC++JavaJavaScriptGo等多种主流编程语言的代码,在HumanEval-X代码生成任务上取得47%~60%求解率,较其他开源基线模型有更佳的平均性能。

跨语言代码翻译:支持代码片段在不同编程语言间进行自动翻译转换,翻译结果正确率高,在HumanEval-X代码翻译任务上超越了其它基线模型。

自动编程插件:CodeGeeX插件现已上架VSCode插件市场(完全免费),用户可以通过其强大的少样本生成能力,自定义代码生成风格和能力,更好辅助代码编写。

模型跨平台开源: 所有代码和模型权重开源开放,用作研究用途。CodeGeeX同时支持昇腾和英伟达平台,可在单张昇腾910或英伟达V100/A100上实现推理。



https://github.com/THUDM/CodeGeeX

2023-03-30

LMFlow

一个可扩展、方便和高效的工具箱,用于微调大型机器学习模型,旨在用户友好、快速可靠,并且对整个社区开放。

https://github.com/OptimalScale/LMFlow

2023-04-02

DeepSpeed-Chat

DeepSpeed Chat: 一键式RLHF训练,可以让类ChatGPT千亿大模型提速省钱15

https://github.com/microsoft/DeepSpeed/tree/master/blogs/deepspeed-chat/chinese

2023-04-12

AutoGPT

Auto-GPT是一个实验性的开源应用程序,展示了GPT-4语言模型的能力。这个程序由GPT-4驱动,将LLM“思想链接在一起,以自主地实现您设定的任何目标。作为GPT-4完全自主运行的首批示例之一,Auto-GPT推动了人工智能可能性的界限。

https://github.com/Torantulino/Auto-GPT

2023-04-12

MiniGPT-4

MiniGPT-4:使用先进的大型语言模型增强视觉语言理解

https://github.com/Vision-CAIR/MiniGPT-4

2023-04-17

StableLM

Stability AI发布了一个新的开源语言模型——StableLM。该模型的Alpha版本可用于30亿和70亿个参数,随后还将推出150亿到650亿个参数的模型。

https://github.com/Stability-AI/StableLM

2023-04-19

ImageBind

ImageBind学习了六种不同模态的联合嵌入——图像、文本、音频、深度、热成像和IMU数据。它使得新颖的应用程序开箱即用,包括跨模态检索,使用算术组合模态,跨模态检测和生成等。

https://github.com/facebookresearch/ImageBind

2023-05-09

 

ChatGPT产品相关Github项目

产品名称

简介

项目地址

OpenAI-translator

基于 ChatGPT API 的划词翻译浏览器插件和跨平台桌面端应用

https://github.com/yetone/openai-translator

sql-translator

一款基于人工智能的可以将自然语言转换为SQL的开源项目。

https://github.com/whoiskatrin/sql-translator

ChatGPT

一款封装了ChatGPT网页的桌面版ChatGPT应用。

https://github.com/lencx/ChatGPT

Chatgpt-web

一款基于Express Vue3 搭建的 ChatGPT 演示网页,可自定义配置OpenAIAPI-key来搭建自己的私人ChatGPT

https://github.com/Chanzhaoyu/chatgpt-web

Chatbox

跨平台桌面应用程序,用于ChatGPT APIOpenAI API),同时也是一个Prompts调试和管理工具。

GitHub - Bin-Huang/chatbox: A cross-platform desktop application for ChatGPT API (OpenAI API), also a prompt debugging and management tool.

 



ChatGPT相关投研报告

机构名称

报告题目

报告地址

发表时间

国泰君安

ChatGPT研究框架

 

http://www.evinchina.com/uploadfile/file/20230315/2023031509402407539.pdf

2023-03-15

华福证券

AIGC&ChatGPT发展报告

https://file.digitaling.com/eImg/uimages/20230315/1678850891384221.pdf

2023-03-15

民生证券

ChatGPT在金融应用前景

https://pdf.dfcfw.com/pdf/H3_AP202302141583130912_1.pdf?1676380961000.pdf

2023-02-14

民生证券

ChatGPT 系列报告:为人形机器人注入灵魂

https://file.iyanbao.com/pdf/8ba6d-ae00799f-58a7-4ed1-9aeb-d996f9b129c2.pdf

2023-02-14

德邦证券

ChatGPT 热度加速 AI 算力投资,光通信产业链或将持续受益

https://pdf.dfcfw.com/pdf/H3_AP202302101582992163_1.pdf?1676025822000.pdf

2023-02-10

招银国际

ChatGPT 跨行业专题报告

http://pg.jrj.com.cn/acc/Res/CN_RES/INDUS/2023/2/10/ec712afa-897b-4d71-9f1b-024b3297d4ea.pdf

2023-02-10

银河证券

ChatGPT 开启 AI 新纪元,AIGC 投资框架梳理

http://pg.jrj.com.cn/acc/Res/CN_RES/INDUS/2023/2/17/f09adc71-936c-4029-a8b7-e2902dfbb6e7.pdf

2023-02-17

浦银国际

序幕揭开:ChatGPT AIGC 推向平民化时代

http://www.spdbi.com/getfile/index/action/images/name/63ecba91c248f.pdf

2023-02-14

长城证券

ChatGPT 概念发酵,建议关注泛 AI产业链

http://www.cgws.com/cczq/ggdt/ccyj/202302/P020230222308526770156.pdf

2023-02-22

华龙证券

当下最成功的 C 端人工智能应用——ChatGTP点评报告

http://www.hlzqgs.com/upload/20230221/202302211676969060330.pdf

2023-02-21

偉祿亞太證券

人工智能:AIGCChatGPT

 

https://www.realordapsec.com/wp-content/uploads/2023/02/%E7%A0%94%E7%A9%B6%E5%A0%B1%E5%91%8A-ChatGPT-%E4%BA%BA%E5%B7%A5%E6%99%BA%E6%85%A7-SC.pdf

2023-02-17

 

ChatGPT相关产品

ChatGPT产品

产品名称

产品介绍

官网地址

文心一言

百度发布的一款类似于ChatGPT的产品。

https://yiyan.baidu.com/welcome

New Bing

微软发布的基于GPT-4的类似于ChatGPT的产品。

https://www.bing.com/new

通义千问

达摩院发布的一款大语言模型产品

https://tongyi.aliyun.com/

open-assistant

开放助手(简称OA)是一个基于聊天的开源助手。该项目的愿景是创建一个可以在单个高端消费级GPU上运行的大型语言模型。通过一些修改,Open Assistant也应该能够轻松地与其他第三方应用程序进行接口,并从数据库和互联网中检索信息。

https://open-assistant.io/

 

ChatGPT非官方产品

产品名称

产品介绍

官网地址

Poe

一款集成了ChatGPTGPT-4ClaudeClaude+SageDragonfly的聊天机器人hub

https://poe.com/

 

ChatGPT AI工具

产品工具名称

介绍

官网地址

BloopAI

一款使用GPT-4和语义代码搜索来理解代码库的AI软件

https://bloop.ai/

Cursor

一款基于GPT-4开发的进行辅助编程的软件。

Cursor | Build Fast

OpenL

一款基于OpenAI的翻译工具网站。支持15种常见语言,另外还提供了writer功能,可修正语法和润色文章。免费用户有20个额度

https://openl.io

Browse AI

一款预构建的网络爬虫机器人,可以在2分钟内构建机器人,无需写代码,帮你爬取需要的任何资源。

https://www.browse.ai/

Hypotenuse AI

一款基于AI的写作助手。

https://www.hypotenuse.ai/

There's an ai for that

一个收集了能完成很多任务的AI工具集合网站。

https://theresanaiforthat.com/

Durable AI Website Builder

基于AI30秒内构建一个网站。

https://durable.co/ai-website-builder

Delv AI

一款基于GPT-3的可以帮助从任何文本中进行总结的工具。

https://www.delv.ai/

Perplexity AI

一款旨在于替代Google的人工智能搜索引擎。

https://www.perplexity.ai/

ChatPDF

ChatPDF是与任何PDF快速、简便地聊天的方式,免费且无需登录。

https://www.chatpdf.com/

ChatExcel

通过文字聊天实现Excel的交互控制的AI辅助工具

https://chatexcel.com/

ChatDoc

一个基于ChatGPT的文件阅读助手,可以快速从PDF中提取、定位和总结信息。

ChatDOC - Chat with your documents

Humata

一个基于ChatGPT的文件理解助手

https://www.humata.ai/

LLamaChat

LlamaChat允许您与在Mac本地运行的LLaMaAlpacaGPT4All模型进行聊天。可直接下载LLamaAlpacaGPT4All模型后直接进行使用。

https://llamachat.app/

 

多模态产品

产品名称

介绍

官网地址

Midjourney

AI绘画创作工具

https://www.midjourney.com/

Stable Diffusion

一种潜在的文本到图像扩散模型,能够生成逼真的照片,只需输入任何文本即可。它培养了自主创作的自由,产生了令人惊叹的图像,并使数十亿人能够在几秒钟内创造出令人惊叹的艺术作品。

https://stablediffusionweb.com/

 



 

相关文章
|
6月前
|
存储 编译器 Go
结合ChatGPT辅助学习Go语言底层原理
在当今的信息时代,编程语言已经成为了科技领域的基础工具之一。其中,Go语言以其简洁、高效和并发性强等优点,在开发者中赢得了广泛的好评。然而,对于初学者或是想要深入理解Go语言底层原理的人来说,直接阅读和理解其源码可能会面临一定困难。我主要从以下几个方面分享一些使用ChatGPT辅助学习Go语言底层源码的小技巧。
202 0
结合ChatGPT辅助学习Go语言底层原理
|
7月前
|
搜索推荐
ChatGPT将会成为强者的外挂?—— 提高学习能力
ChatGPT将会成为强者的外挂?—— 提高学习能力
125 0
|
1月前
|
数据采集 人工智能 搜索推荐
【ChatGPT 指令大全】怎么使用ChatGPT来辅助知识学习
【ChatGPT 指令大全】怎么使用ChatGPT来辅助知识学习
23 0
|
1月前
|
人工智能 搜索推荐
【ChatGPT 指令大全】怎么使用ChatGPT来辅助学习英语
【ChatGPT 指令大全】怎么使用ChatGPT来辅助学习英语
29 1
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
ChatGPT 未来学习手册
ChatGPT 未来学习手册
27 0
|
11月前
如何让ChatGPT学习销售过往文字稿,并自动分析话术的优缺点,然后修改?
产品特点、服务优势、目标客户需求和痛点、行业与市场的趋势变化、竞争对手的优劣势、销售场景的特点和要求、销售环境、销售氛围、时间、地点、客户情感需求、心理转态、个性特点、解决方案
261 0
如何让ChatGPT学习销售过往文字稿,并自动分析话术的优缺点,然后修改?
|
6月前
|
机器学习/深度学习 数据采集 自然语言处理
chat GPT数据学习分析应用
ChatGPT是一种强大的自然语言处理模型,可以在数据分析学习阶段提供帮助和支持。在这一阶段,你将学习各种数据分析技术和工具,包括数据清洗、数据可视化、统计分析和机器学习等。ChatGPT可以作为一个交互式的学习工具,帮助你理解和应用这些技术。下面将详细介绍ChatGPT在数据分析学习阶段的应用。 1. 数据清洗和预处理: 数据清洗和预处理是数据分析的第一步,也是最关键的一步。ChatGPT可以帮助你处理和清洗数据,包括缺失值处理、异常值检测和处理、数据格式转换等。你可以与ChatGPT进行对话,告诉它你的数据清洗需求,它可以给出相应的建议和指导。例如,你可以向ChatGPT描述你的数据集中
91 0
|
7月前
|
设计模式 人工智能 Java
停止摆烂!ChatGPT 指令学习带你秒变聪明!
停止摆烂!ChatGPT 指令学习带你秒变聪明!
停止摆烂!ChatGPT 指令学习带你秒变聪明!
|
8月前
|
机器学习/深度学习 人工智能 算法
学习 ChatGPT 一切基础知识的绝佳资源
OpenAI,ChatGPT,GPT系列和大型语言模型(LLM)一般 - 如果你与人工智能专业或技术专家有远程联系,你很有可能会在几乎所有的商业对话中听到这些词这些天。 炒作是真实的。我们不能再称它为泡沫了。毕竟,这一次,炒作正在兑现其承诺。 谁会想到机器可以理解和恢复类似人类的智能,并完成几乎所有以前被认为是人类强项的任务,包括音乐的创造性应用,写诗,甚至编程应用?
52 0
|
9月前
|
人工智能 自然语言处理
利用ChatGPT场景化学习英语听说读写
利用ChatGPT场景化学习英语听说读写
174 0
利用ChatGPT场景化学习英语听说读写