大白话讲清楚：什么是 Langchain 及其核心概念-阿里云开发者社区

大白话讲清楚：什么是 Langchain 及其核心概念

2024-05-07 1184

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 大白话讲清楚：什么是 Langchain 及其核心概念

在AI和机器学习领域，每天都有新技术和框架涌现。今天，我们来聊聊最近引起广泛关注的一个框架 —— Langchain。

https://python.langchain.com/docs/get_started/introduction

那么，Langchain到底是什么，它为什么这么受欢迎，以及它是如何工作的呢？

别担心，我会用大白话帮你一步步弄明白！

1、Langchain 简介

想象一下，如果你能让聊天机器人不仅仅回答通用问题，还能从你自己的数据库或文件中提取信息，并根据这些信息执行具体操作，比如发邮件，那会是什么情况？Langchain 正是为了实现这一目标而诞生的。

Langchain 是一个开源框架，它允许开发人员将像 GPT-4 这样的大型语言模型与外部的计算和数据源结合起来。目前，它提供了 Python 和 JavaScript（确切地说是 TypeScript）的软件包。

上图展示了Langchain的工作原理，这是一个用于提升大型语言模型（LLMs）功能的框架。

它通过三个核心组件实现增强：

首先是 Compents“组件”，为LLMs提供接口封装、模板提示和信息检索索引；
其次是 Chains“链”，它将不同的组件组合起来解决特定的任务，比如在大量文本中查找信息；
最后是 Agents“代理”，它们使得LLMs能够与外部环境进行交互，例如通过API请求执行操作。

Langchain 的这种结构设计使LLMs不仅能够处理文本，还能够在更广泛的应用环境中进行操作和响应，大大扩展了它们的应用范围和有效性。

如果上面还不够大白话，我的理解 LangChain 就等价于数据库领域的 JDBC。

LangChain 和 JDBC 确实有一些相似之处，特别是它们都作为连接和集成不同系统的桥梁。

它们都扮演了一种中介的角色，允许开发者利用特定技术（AI 或数据库）与其他系统或应用进行交互。

2、为什么要用 Langchain？

数据连接：Langchain 允许你将大型语言模型连接到你自己的数据源，比如数据库、PDF文件或其他文档。这意味着你可以使模型从你的私有数据中提取信息。

行动执行：不仅可以提取信息，Langchain 还可以帮助你根据这些信息执行特定操作，如发送邮件。无需硬编码：它提供了灵活的方式来动态生成查询，避免了硬编码的需求。

3、Langchain 核心概念

Langchain 由几个核心概念组成：

LLM Wrappers：这些包装器允许你连接到大型语言模型，如 GPT-4 或 Hugging Face 提供的模型。Prompt Templates：这些模板让你避免硬编码文本输入。你可以动态地将用户输入插入到模板中，并发送给语言模型。Indexes：索引帮助你从语言模型中提取相关信息。Chains：链允许你将多个组件组合在一起，解决特定的任务，并构建完整的语言模型应用程序。Agents：代理允许语言模型与外部API交互。

上图展示了一个复杂的语言处理系统，其中包含模型、提示、链、代理和嵌入与向量存储。

模型 Models 负责理解和生成语言，提示用于引导模型输出；
链条 Chains 代表将多个步骤串联起来完成复杂任务的过程；
代理 Agents 则用于让模型与外部环境互动，比如执行API调用。
Embedding 嵌入与向量存储 VectorStore 是数据表示和检索的手段，为模型提供必要的语言理解基础。

图中的鹦鹉是一个比喻或者象征，表示这个系统的自然语言处理能力，或者可能暗示系统的输出可以像鹦鹉一样“复述”或者是“回应”用户的输入。如此，这整个系统构成了一个高度集成的框架，能够处理高级语言任务并在多种环境下进行动态交互。

4、Langchain 如何工作？

Langchain 的工作流程可以概括为以下几个步骤：

提问：用户提出问题。向语言模型查询：问题被转换成向量表示，用于在向量数据库中进行相似性搜索。获取相关信息：从向量数据库中提取相关信息块，并将其输入给语言模型。生成答案或执行操作：语言模型现在拥有了初始问题和相关信息，能够提供答案或执行操作。

举例：如上图所示展示了一个智能问答系统的工作流程，它从用户提出的问题（Question）开始，然后通过相似性搜索（Similarity Search）在一个大型数据库或向量空间中找到与之相关的信息。

得到的信息与原始问题结合后，由一个处理模型分析，以产生一个答案（Answer）。

这个答案接着被用来指导一个代理采取行动（Action），这个代理可能会执行一个API调用或与外部系统交互以完成任务。

整个流程反映了数据驱动的决策过程，其中包含了从信息检索到处理，再到最终行动的自动化步骤。

5、Langchain 应用场景

Langchain 的应用场景非常广泛，包括但不限于：

个人助手：可以帮助预订航班、转账、缴税等。

学习辅助：可以参考整个课程大纲，帮助你更快地学习材料。

数据分析和数据科学：连接到公司的客户数据或市场数据，极大地促进数据分析的进展。

总之，Langchain 打开了一个充满可能性的新世界，让AI技术更加贴近我们的实际需求和数据，使得机器学习应用的发展更加多样化和个性化。

希望这篇文章能帮你对 Langchain 有了更清晰的认识！

下一篇有代码实战，你不妨也过一下哈。欢迎留言交流......

参考

1.https://www.youtube.com/watch?v=lG7Uxts9SXs

2.https://www.youtube.com/watch?v=aywZrzNaKjs