整合LlamaIndex与LangChain构建高级的查询处理系统

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时计算 Flink 版,1000CU*H 3个月
简介: 该文阐述了如何结合LlamaIndex和LangChain构建一个扩展性和定制性强的代理RAG应用。LlamaIndex擅长智能搜索,LangChain提供跨平台兼容性。代理RAG允许大型语言模型访问多个查询引擎,增强决策能力和多样化回答。文章通过示例代码展示了如何设置LLM、嵌入模型、LlamaIndex索引及查询引擎,并将它们转换为LangChain兼容的工具,实现高效、精准的问题解答。通过多代理协作,系统能处理复杂查询,提高答案质量和相关性。

构建大型语言模型应用程序可能会颇具挑战,尤其是当我们在不同的框架(如Langchain和LlamaIndex)之间进行选择时。LlamaIndex在智能搜索和数据检索方面的性能令人瞩目,而LangChain则作为一个更加通用的应用程序框架,提供了更好的与各种平台的兼容性。

本篇文章将介绍如何将LlamaIndex和LangChain整合使用,创建一个既可扩展又可定制的代理RAG(Retrieval-Augmented Generation)应用程序,利用两种技术的强大功能,开发出能够处理复杂查询并提供精准答案的高效应用程序。

在我们继续实施之前,需要简单的介绍代理RAG的一些知识:

代理RAG是一种基于代理的RAG实现方式。与传统的一般RAG方法相比,代理RAG在自主性和决策能力方面有了显著提升。我们通过授权大型语言模型(LLM)访问多个RAG查询引擎来创建一个复杂的推理循环。每个查询引擎都作为一种工具,能根据需要被LLM调用。这种结构不仅使得执行复杂决策成为可能,还扩展了系统回答各种查询的能力,并能够更好地为用户提供最适宜的响应。

通过这种方式,代理RAG能够在提供答案的同时,考虑到信息的来源多样性和质量,从而在提供答案时实现更高的准确性和相关性。这种模型的实现,为处理复杂问题和提供创新解决方案提供了更强大的工具。

首先我们定义基本LLM和嵌入模型

 # LLM 
 llm=ChatOpenAI(model_name="gpt-4-1106-preview", temperature=0, streaming=True)

 # Embedding Model
 embed_model=OpenAIEmbedding(
     model="text-embedding-3-small", embed_batch_size=100
 )

 # Set Llamaindex Configs
 Settings.llm=llm
 Settings.embed_model=embed_model

然后利用LlamaIndex的索引和检索功能为文档定义单独的查询引擎。

 #Building Indexes for each of the Documents
 try:
     storage_context=StorageContext.from_defaults(
         persist_dir="./storage/lyft"
     )
     lyft_index=load_index_from_storage(storage_context)

     storage_context=StorageContext.from_defaults(
         persist_dir="./storage/uber"
     )
     uber_index=load_index_from_storage(storage_context)

     index_loaded=True
     print("Index was already created. We just loaded it from the local storage.")

 except:

     index_loaded=False
     print("Index is not present. We need it to create it again.")

 ifnotindex_loaded:

     print("Creating Index..")

     # load data
     lyft_docs=SimpleDirectoryReader(
         input_files=["./data/10k/lyft_2021.pdf"]
     ).load_data()
     uber_docs=SimpleDirectoryReader(
         input_files=["./data/10k/uber_2021.pdf"]
     ).load_data()

     # build index
     lyft_index=VectorStoreIndex.from_documents(lyft_docs)
     uber_index=VectorStoreIndex.from_documents(uber_docs)

     # persist index
     lyft_index.storage_context.persist(persist_dir="./storage/lyft")
     uber_index.storage_context.persist(persist_dir="./storage/uber")

     index_loaded=True

 #Creating Query engines on top of the indexes
 lyft_engine=lyft_index.as_query_engine(similarity_top_k=3)
 uber_engine=uber_index.as_query_engine(similarity_top_k=3)

 print("LlamaIndex Query Engines created successfully.")

然后使用LlamaIndex的QueryEngineTool抽象类将查询引擎转换为工具,这些工具将稍后提供给LLM使用。

 #creating tools for each of our query engines
 query_engine_tools= [

     QueryEngineTool(
         query_engine=lyft_engine,
         metadata=ToolMetadata(
             name="lyft_10k",
             description=(
                 "Provides information about Lyft financials for year 2021. "
                 "Use a detailed plain text question as input to the tool."
             ),
         ),
     ),
     QueryEngineTool(
         query_engine=uber_engine,
         metadata=ToolMetadata(
             name="uber_10k",
             description=(
                 "Provides information about Uber financials for year 2021. "
                 "Use a detailed plain text question as input to the tool."
             ),
         ),
     ),
 ]

然后我们将LlamaIndex工具转换为与Langchain代理兼容的格式,这样就可以和Langchain 进行对接了。

 llamaindex_to_langchain_converted_tools= [t.to_langchain_tool() fortinquery_engine_tools]

除此以外我们还定义了一个附加的带有Web搜索功能的Langchain工具。这样可以进行页面搜索

 search=DuckDuckGoSearchRun()

 duckduckgo_tool=Tool(
         name='DuckDuckGoSearch',
         func=search.run,
         description='Use for when you need to perform an internet search to find information that another tool can not provide.'
 )   

 langchain_tools= [duckduckgo_tool]


 #Combine to create final list of tools
 tools=llamaindex_to_langchain_converted_tools+langchain_tools

下面就是Langchain的工作了,初始化调用代理。

 system_context="You are a stock market expert.\
 You will answer questions about Uber and Lyft companies as in the persona of a veteran stock market investor."

 prompt=ChatPromptTemplate.from_messages(
     [
         (
             "system",
             system_context,
         ),
         ("placeholder", "{chat_history}"),
         ("human", "{input}"),
         ("placeholder", "{agent_scratchpad}"),
     ]
 )

 # Construct the Tools agent
 agent=create_tool_calling_agent(llm, tools, prompt,)

 # Create an agent executor by passing in the agent and tools
 agent_executor=AgentExecutor(agent=agent, tools=tools, verbose=True, return_intermediate_steps=True, handle_parsing_errors=True, max_iterations=10)

然就就可以进行测试了。

测试1:

 question =  "What was Lyft's revenue growth in 2021?"

 response = agent_executor.invoke({"input": question})
 print("\nFinal Response:", response['output'])

代理正确地调用了lyft_10k查询引擎工具。

测试2:

 question =  "Is Uber profitable?"

 response = agent_executor.invoke({"input": question})
 print("\nFinal Response:", response['output'])

代理正确调用了uber_10k查询引擎工具。

测试3:

 question =  "List me the names of Uber's board of directors."

 response = agent_executor.invoke({"input": question})
 print("\nFinal Response:", response['output'])

我们这个信息超出了任何检索工具的范围,所以代理决定调用外部搜索工具,然后返回结果。

可以看到,我们的例子完美的结合了2者的优势,通过引入多个代理可以进一步提高系统的效率和精准度。每个代理可以专门处理同一领域内的不同文档子集,使得信息检索更为精细和专业。

我们可以设定一名代理来担任这些代理的协调者或主管。这名负责监控和调节各个代理的活动,确保信息流动的协调一致,并对整体查询过程进行优化。这种层次化的管理结构不仅优化了数据处理流程,也提高了响应速度和准确性,使得整个系统在处理复杂查询时更加高效和可靠。

通过这种方法,我们可以实现一个更加动态和适应性强的RAG系统,能够更好地满足不断变化的用户需求和应对多样化的信息挑战。希望本文能帮助你了解如何有效地整合LlamaIndex和LangChain,以构建一个高效、可扩展的代理RAG应用程序。
https://avoid.overfit.cn/post/f314677d41904595b953a6a3e7349705

相关实践学习
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
相关文章
|
2月前
|
人工智能 缓存 监控
使用LangChain4j构建Java AI智能体:让大模型学会使用工具
AI智能体是大模型技术的重要演进方向,它使模型能够主动使用工具、与环境交互,以完成复杂任务。本文详细介绍如何在Java应用中,借助LangChain4j框架构建一个具备工具使用能力的AI智能体。我们将创建一个能够进行数学计算和实时信息查询的智能体,涵盖工具定义、智能体组装、记忆管理以及Spring Boot集成等关键步骤,并展示如何通过简单的对话界面与智能体交互。
930 1
|
2月前
|
人工智能 Java API
构建基于Java的AI智能体:使用LangChain4j与Spring AI实现RAG应用
当大模型需要处理私有、实时的数据时,检索增强生成(RAG)技术成为了核心解决方案。本文深入探讨如何在Java生态中构建具备RAG能力的AI智能体。我们将介绍新兴的Spring AI项目与成熟的LangChain4j框架,详细演示如何从零开始构建一个能够查询私有知识库的智能问答系统。内容涵盖文档加载与分块、向量数据库集成、语义检索以及与大模型的最终合成,并提供完整的代码实现,为Java开发者开启构建复杂AI智能体的大门。
1429 58
存储 人工智能 机器人
102 0
|
2月前
|
人工智能 安全 数据库
构建可扩展的 AI 应用:LangChain 与 MCP 服务的集成模式
本文以LangChain和文件系统服务器为例,详细介绍了MCP的配置、工具创建及调用流程,展现了其“即插即用”的模块化优势,为构建复杂AI应用提供了强大支持。
|
3月前
|
机器学习/深度学习 算法 大数据
构建数据中台,为什么“湖仓一体”成了大厂标配?
在大数据时代,数据湖与数据仓库各具优势,但单一架构难以应对复杂业务需求。湖仓一体通过融合数据湖的灵活性与数据仓的规范性,实现数据分层治理、统一调度,既能承载海量多源数据,又能支撑高效分析决策,成为企业构建数据中台、推动智能化转型的关键路径。
|
4月前
|
数据采集 存储 分布式计算
一文读懂数据中台架构,高效构建企业数据价值
在数字化时代,企业面临数据分散、难以统一管理的问题。数据中台架构通过整合、清洗和管理数据,打破信息孤岛,提升决策效率。本文详解其核心组成、搭建步骤及常见挑战,助力企业高效用数。
1724 24
|
6月前
|
SQL 机器学习/深度学习 监控
构建数据中枢:数据中台指标体系如何赋能企业运营
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
6月前
|
存储 机器学习/深度学习 人工智能
使用 LangChain + Higress + Elasticsearch 构建 RAG 应用
本文介绍了如何利用LangChain、Higress和Elasticsearch快速构建RAG(检索增强生成)应用,实现企业知识的智能检索与问答。首先通过LangChain解析Markdown文档并写入Elasticsearch,接着部署Higress AI网关并配置ai-search插件以整合私有知识库与在线搜索功能。最后,通过实际案例展示了RAG查询流程及结果更新机制,确保内容准确性和时效性。文章还提供了相关参考资料以便进一步学习。
713 38
|
7月前
|
存储 人工智能 监控
通过Milvus和Langchain快速构建基于百炼大模型的LLM问答系统
阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。