基于RAG和LLM的水利知识问答系统研究

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
视觉智能开放平台,分割抠图1万点
简介: 随着全球水资源紧张加剧,我国面临严峻的水资源管理挑战。《十四五规划》提出构建智慧水利体系,通过科技手段提升水情测报和智能调度能力。基于大语言模型(LLM)的水利智能问答系统,利用自然语言处理技术,提供高效、准确的水利信息查询和决策支持,助力水资源管理智能化。该系统通过RAG技术和Agent功能,实现了对水利知识的深度理解和精准回答,适用于水利知识科普、水务治理建议及灾害应急决策等多个场景,推动了水利行业的信息化和智能化发展。

随着全球水资源的日益紧张,我国人均水资源量偏低,约三分之二的城市面临缺水问题,水资源的精细化管理显得尤为重要。为了应对这一挑战,提升水利工程的效率和智能化水平成为关键。《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中明确提出了构建智慧水利体系的目标,旨在通过科技手段提升水情测报和智能调度能力。
在这一背景下,基于大语言模型(LLM)的水利智能问答系统因其在提升水资源管理水平方面的潜力而受到关注[1]。这类系统能够通过自然语言处理技术,提供高效、准确的水利信息查询和决策支持,从而帮助管理者更好地应对水资源挑战。LLM的发展为垂直领域知识抽取和知识图谱构建提供了新的解决方案,为水利领域的智能化管理带来了新机遇。
然而现有的水利知识问答系统受限于固定模板,但LLM的发展为垂直领域知识抽取提供了新的解决方案,为知识图谱构建带来新机遇[2]。LLM在对话系统、情感分析、机器翻译和文本摘要等自然语言处理任务中展现出卓越的语言处理能力[3][4],提高了语言表达的准确性和自然性。基于LLM的推荐方法也提高了推荐系统的准确性和个性化程度,拓展了应用场景,引起了研究者的关注[5][6]。
综上所述,基于LLM的水利智能问答系统不仅能够提供更自然、灵活的对话交互,还能根据用户输入生成多样化回答,从而推动水利行业的智能化发展。
2 当前大语言模型和水利知识问答系统的现状
自ChatGPT等大语言模型问世以来,智能对话领域迎来了全新的变革。这些大语言模型通过深度学习技术,能够更深入地理解用户的意图和需求,实现更加自然和灵活的对话交互。其复杂推理能力,显著提高复杂问题的回答质量。与传统的水利知识问答系统相比,大语言模型不再受限于固定的语言模板,而是能够根据用户的输入和上下文信息,生成丰富多样的回答。
该项目的实施将推动水利科技创新发展。在研究过程中,需要探索大语言模型在水利领域的应用方法和技术,不断优化模型的性能和准确性。大语言模型适合处理各种类型和领域的文本数据,与提示学习的结合能最大限度的利用大语言模型的泛化能力[7]。这将为水利行业引入新的技术手段和方法,推动水利科技创新的不断进步。
3 水利知识问答系统的研究步骤
本系统的研究步骤分为四步,具体如下:
3.1 数据收集和处理
在研究初期,搜集水利类知识相关书籍、期刊、规范、设计手册等权威资料,同时从政府网站、行业协会等渠道获取最新政策、法规和标准,建立一个全面的水利综合知识库。该知识库将涵盖水利科普常识、水旱灾害防御、防汛历史案例、水利史、水利风景、河湖数据以及相关法律法规等知识。
3.2 调用大语言模型
为了实现对输入信息的提取和解析,选择适用于自然语言处理任务的大语言模型。在选择时,我们需要考虑大模型的性能、训练效果、计算资源等要求,同时还需要考虑连接大模型的网络速度。在LLM选择方面,本系统为用户提供了多样化的选择,用户不仅可以选择目前中文处理能力最强DeepseekV2.5:127b的在线大模型,同时本系统也基于NVIDIA V100服务器集群和Ollama运行了的知名的Qwen:7b本地大模型,使大模型运行速度有了显著的提升。用户可以根据自己对回答效果和运行速度的需求自由选择本系统的LLM,定制化程度更高。
3.3 大语言模型解析
利用我们选择的大语言模型,基于检索增强生成(RAG)对本地知识库进行解析,同时在系统后台对本系统用户输入的自然语言进行解析,抽取关键词,解析用户的意图。此步骤旨在确保该问答系统能够理解用户提问并准确定位到相关水利知识库做出回答。
3.4 系统设计与架构开发
处理完大模型后,本研究开始着手进行完整系统的开发。前端页面采用React开发,设计出登录界面、问答界面、Agent管理界面、文件管理界面、知识库管理界面以及管理员后台管理界面,后端采用Python的Flask框架,在小而精的同时安全性能够得到保证。数据库采用目前主流的MySQL5。
在系统实际运行中,不但要对水利知识知识库进行简单的查询,而且需要大模型对知识库里的数据进行数据分析并得到关键问题的答案反馈给用户。所以使用RAG + Agent 的模式可以使得水利知识问答的生成的答案更加精确、更加贴合实际。
同时,在管理系统方面,本系统也采用了RBAC权限模型,配置了管理员、经理、普通用户三类权限账户,其中管理员账户有最高管理权限,有全部功能的使用权限;经理用户可以管理系统知识库并与管理员账户共享,但不能配置LLM、Prompt、Agent等技术配置;普通用户只能使用最基本的问答功能。
具体如下:
4.4.1检索增强生成(Retrieval-Augmented Generation,简称RAG):
检索增强生成(RAG)是一种创新的方法结合了信息检索和文本生成的人工智能技术,它通过结合大型语言模型(LLM)的生成能力和实时数据检索,来提升人工智能系统在水利领域的性能。

在系统中,首先通过OCR技术将纸质文档转换为可编辑的文本格式,然后利用文档解析技术提取关键信息。这一步骤包括对文档布局的分析、表格结构的识别等,以确保系统能够全面理解文档内容。

任务分发阶段,系统会识别用户查询的具体需求,并将任务分配给相应的处理模块。这一过程涉及到多路召回机制,所谓的“多路召回”策略,就是指采用不同的策略、特征或简单模型,分别召回一部分候选集,然后把候选集混合在一起供后续排序模型使用。
在分析阶段,系统会接收用户的查询,使用embedding将这些查询转换为向量形式。同时,系统也会对水利知识库中的条目进行embedding,创建一个向量空间。接下来,系统执行重排操作,在考虑单个查询与知识库条目的相似度的同时,还会考虑上下文信息和用户的历史交互数据,并通过计算用户查询向量与知识库中各个条目的向量之间的相似度,考虑用户的个人偏好同时,来确定最相关的信息。
而RAG模块与系统后端架构的结合有如下功能。
索引构建:首先需要将相关知识库(如文档、文章、数据库等)进行索引,这通常涉及到文档的分割、向量化和存储。可以使用诸如Elasticsearch、Weaviate、Pinecone等向量数据库来存储这些索引。
检索接口:在Flask应用中创建API接口,用于接收用户查询,并根据查询内容从索引库中检索相关信息。
生成接口:创建另一个API接口,它将用户的查询以及检索到的信息作为输入,发送给语言模型API,并获取生成的答案。
集成与部署:将检索和生成的流程集成到Flask应用中,并部署到服务器上,以便用户可以通过HTTP请求与之交互。
4.4.2 Agent
Agent在AI领域中通常指代一个软件实体,它能够感知环境并采取行动以实现特定目标。本研究开发了低代码制作Agent的功能,管理员只要拖动可视化的执行“代码”模块,即可轻松配置属于自己的水利知识问答系统。本系统中Agent的强大优势如下:
(1)任务分解:在本系统默认配置的水利知识问答系统中,Agent将整个问答流程分解为了人机交互、提取用户问题关键词、在在线搜索引擎中检索结果等步骤,通过这种方式,Agent可以更有效地分配资源,优化每个步骤的执行策略,并减少错误和遗漏的可能性。
(2)人类规划与定义:使用本系统时,管理员可以通过拖动Agent中的具体功能模块,实现各个功能执行的优先级排序,而不用调试各种代码以及参数来进行LLM调优,相对市面上的同类竞品大大降低了使用者的门槛。
(3)减少对提示和模型推理的依赖:在本系统中,管理员无需提前设置很多提示词,只要拖动可视化的逻辑Agent模块,就可以配置出回答效果不错的对话大模型。这意味着Agent可以更加灵活地适应新的任务和环境,而不是仅仅依赖于预先编程的指令。
(4)集成工具和知识:为了执行任务,Agent需要访问和使用各种工具和知识库。这些工具和知识库可以是内部的,比如Agent自己的数据库,也可以是外部的,比如互联网上的资源。通过集成这些工具和知识,Agent能够扩展其能力,执行更复杂的任务。
Agent在系统中的另一重要贡献是支持多场景的全面覆盖。通过模拟水利环境中的各种场景,Agent能够为使用者提供即时问答服务,同时也能作为水利工程师培训的有力工具。
4.5 测试与部署
开发完完整系统后,进行系统集成测试,确保各个组件(前端、后端、数据库、AI大模型)的协同工作无误,同时进行用户测试以收集反馈并根据用户的实际使用体验进行优化。最终将系统部署到云服务器,确保可以扩展和持续可用,满足可能的高访问需求。
4 实用情景
在当前大模型时代,充分发挥大模型的“涌现”能力,并将其有效适配到具体领域场景,已经成为垂直行业建立竞争力的重要关键。在这一背景下,高质量的领域数据与专业知识的融合成为实现这一目标的不可或缺的要素。本系统实现了对水利知识的深度理解和高效问答,有如下几个场景:
(1)为了学习我们中国水文化,学习水利常识,起到对大众的一个科普的作用。
(2)为了给全国各地水务治理方面工作人员提供有效的建议,更好地了解各地水务情况有什么问题,进一步深入了解基层水务问题,提出问题,让大模型提出更有效的建议。
(3)当某地发生洪水、旱灾等自然灾害时,水利系统的工作人员需要快速做出决策来实施补救措施。本系统则可以辅助水利系统的工作人员,结合气象数据、河流水位监测、历史洪水数据等信息,提供应急决策支持。
通过全方面的系统的测试,该系统能够接受用户关于水利知识方面的输入,通过自然语言处理将具体意义输送给大模型,最终以自然语言的形式返回用户所需要的信息。该系统为水利工程师、水利专业教师、制定水利政策相关决策人员提供了一种有效的工具。
5 结语
本文探讨了基于大语言模型的水利知识问答系统的构建与应用,旨在通过先进的人工智能技术提升水利行业的信息化和智能化管理水平。通过整合丰富的水利行业数据,构建了全面的水利知识库,并利用深度学习技术,提高了系统的自然语言处理能力。系统设计采用LLM + RAG 模式,结合了信息检索和文本生成技术,提高了答案的精确性和实用性。实际测试表明,该系统能有效处理水利知识查询,为水利工程师、教育者和政策制定者提供了有力的工具,推动了水利知识的普及和行业的智能化发展。未来,我们将继续优化系统性能,扩展知识库内容,以适应不断变化的水利行业需求,为实现智慧水利贡献力量。
参考文献:
[1] GOERTZEL B. Artificial general intelligence:concept, state of the art, and future prospectsll. journal of artificial general intelligence, 2014, 5(1):1-48.
[2] 杨燕,叶枫,许栋,等.融合大语言模型和提示学习的数字孪生水利知识图谱构建[J/OL].计算机应用,1-11[2024-10-18].http://kns.cnki.net/kcms/detail/51.1307.TP.20240824.1732.002.html.
[3] 程秀峰,李嘉琦,杨金庆,等.大语言模型对学术论文评价的可利用性 探讨[J].图书情报工作,2024,68(18):41-49.DOI:10.13266/j.issn.0252-3116.2024.18.005.
[4] Touvron H, Lavril T, Izacard G, et al. LLaMA: Open and Efficient Foundation Language Models[J]. arXiv preprint arXiv: 230213971, 2023.
[5] Dai S, Shao N, Zhao H, et al. Uncovering ChatGPT's Capabilities in Recommender Systems[C]. Proceedings of the 17th ACM Conference on Recommender Systems, New York, USA, 2023:1126-1132
[6] Liu J, Liu C, Lv R, et al. Is ChatGPT a Good Recommender? A Preliminary Study[C]. Proceedings of the 32nd ACM International Conference on Information and Knowledge Management 2023, Birmingham, United Kingdom, 2023:1-11.
[7] 温森,钱丽,胡茂迪,eta.基于大型语言模型的问答技术研究进展综述.数据分析与知识发现,2024,8(6): 16.29 https://doi.org/10.11925/infotech.2096-3467.2023.0839

相关文章
|
11天前
|
物联网
LLM破局泛化诊断难题,MSSP刊登北航PHM实验室健康管理大模型交叉研究
北航PHM实验室提出了一种基于大型语言模型(LLM)的轴承故障诊断框架,结合传统诊断技术,解决了跨条件适应性、小样本学习和跨数据集泛化等问题。该框架通过信号特征量化方法提取振动数据的语义信息,并采用LoRA和QLoRA微调预训练模型,显著提升了诊断模型的泛化能力。实验结果显示,在跨数据集训练中,模型准确性提升了约10%,相关成果发表于《Mechanical Systems and Signal Processing》期刊。尽管存在计算资源需求高等挑战,该研究为旋转机械的高效维护提供了新思路。
26 2
|
19天前
|
人工智能 自然语言处理 数据可视化
Agentic Reasoning:推理界RAG诞生!牛津大学框架让LLM学会『组队打怪』:动态调用搜索/代码代理,复杂任务准确率飙升50%
Agentic Reasoning 是牛津大学推出的增强大型语言模型(LLM)推理能力的框架,通过整合外部工具提升多步骤推理、实时信息检索和复杂逻辑关系组织的能力。
76 1
|
1月前
|
人工智能 自然语言处理 算法
LLM为何频频翻车算术题?最新研究追踪单个神经元,大脑短路才是根源
最新研究揭示,大型语言模型(LLM)在解决算术问题时依赖于一组稀疏的重要神经元,这些神经元实现简单的启发式算法,而非稳健的算法或记忆训练数据。通过因果分析,研究人员发现这些启发式算法的组合是LLM产生正确算术答案的主要机制,并在训练早期就已形成。这为改进LLM的算术能力提供了新方向。论文地址:https://arxiv.org/abs/2410.21272
53 10
|
1月前
|
人工智能
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你LLM+外部数据的正确使用姿势
在人工智能领域,大型语言模型(LLM)结合外部数据展现出强大能力,尤其检索增强生成(RAG)和微调技术备受关注。然而,不同专业领域的有效部署仍面临挑战,如准确检索数据、理解用户意图等。综述文章《Retrieval Augmented Generation (RAG) and Beyond》提出RAG任务分类方法,将用户查询分为四个级别,并探讨了外部数据集成的三种形式:上下文、小型模型和微调。文章提供了宝贵见解和实用指导,帮助更好地利用LLM潜力解决实际问题。论文链接:https://arxiv.org/abs/2409.14924
73 6
|
11天前
|
人工智能 机器人
D1net阅闻 | 谷歌DeepMind研究发现LLM新特性
D1net阅闻 | 谷歌DeepMind研究发现LLM新特性
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI自己长出了类似大脑的脑叶?新研究揭示LLM特征的惊人几何结构
近年来,大型语言模型(LLM)的内部运作机制备受关注。麻省理工学院的研究人员在论文《The Geometry of Concepts: Sparse Autoencoder Feature Structure》中,利用稀疏自编码器(SAE)分析LLM的激活空间,揭示了其丰富的几何结构。研究发现,特征在原子、大脑和星系三个尺度上展现出不同的结构,包括晶体结构、中尺度模块化结构和大尺度点云结构。这些发现不仅有助于理解LLM的工作原理,还可能对模型优化和其他领域产生重要影响。
104 25
|
3月前
|
弹性计算 自然语言处理 数据库
通过阿里云Milvus和LangChain快速构建LLM问答系统
本文介绍如何通过整合阿里云Milvus、阿里云DashScope Embedding模型与阿里云PAI(EAS)模型服务,构建一个由LLM(大型语言模型)驱动的问题解答应用,并着重演示了如何搭建基于这些技术的RAG对话系统。
|
4月前
|
自然语言处理 算法
RAG真能提升LLM推理能力?人大最新研究:数据有噪声,RAG性能不升反降
随着大型语言模型(LLM)在自然语言处理领域的广泛应用,检索增强生成(RAG)技术因能引入新知识和减少幻觉而受到关注。然而,RAG对LLM推理能力的实际提升效果仍存争议。中国人民大学的一项研究表明,RAG虽能辅助LLM推理,但在处理含噪信息和深度推理时面临挑战。为此,研究团队提出了DPrompt tuning方法,旨在解决噪声问题并提升RAG性能。
100 12
|
4月前
|
JSON 数据可视化 NoSQL
基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践
本文介绍了LangChain的LLM Graph Transformer框架,探讨了文本到图谱转换的双模式实现机制。基于工具的模式利用结构化输出和函数调用,简化了提示工程并支持属性提取;基于提示的模式则为不支持工具调用的模型提供了备选方案。通过精确定义图谱模式(包括节点类型、关系类型及其约束),显著提升了提取结果的一致性和可靠性。LLM Graph Transformer为非结构化数据的结构化表示提供了可靠的技术方案,支持RAG应用和复杂查询处理。
266 2
基于LLM Graph Transformer的知识图谱构建技术研究:LangChain框架下转换机制实践
|
1月前
|
机器学习/深度学习 存储 人工智能
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用,支持多模态交互、多种主流模型选择、离线运行及性能优化。
1542 14
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用