DB-GPT 0.7.5 版本更新:基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

简介: DB-GPT 0.7.5 版本更新,快速预览新特性~

V0.7.5 版本主要新增、增强了以下核心特性

🍀 基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

🍀 优化 Falcon 评测集的加载和支持动态多环境的问题集

🍀 新增 Neo4j 图数据库支持

🍀 支持Elasticsearch的全文检索

🍀 新增指标检索Agent、波动分析Agent增强数据分析能力

🍀 新增WebSerachAgent处理联网搜索场景


✨新特性

1.基于 Falcon 评测集的Text2SQL评测体系全面升级,支持LLM/Agent两种评测模式和多环境评测

a.支持端到端评测LLM在Falcon评测集基准

b.支持评测自定义Agent在Falcon评测集准确率、可执行率

详细的使用文档见:

中文:蚂蚁取数评测集使用说明文档(Datasets Benchmark)

英文:Ant Group Data Retrieval Benchmark Dataset Guide

2.优化 Falcon 评测集的加载和支持动态多环境的问题集

  • Falcon评测集加载优化为运行时动态加载,且从Falcon仓库动态拉取最新问题集
  • 拆分为DEV/TEST多环境问题集,按需评测

3.新增 Neo4j 图数据库支持

扩展Neo4j 数据库,进一步提升 RAG在复杂知识关系处理上的能力

4.支持Elasticsearch的全文检索

在ES支持向量检索的基础上,新增全文检索能力,提升RAG的检索召回能力

5.DB-GPT新增指标检索Agent、波动分析Agent、WebSearchAgent等Agent

image.png


🐞 Bug 修复

  • 修复benchmark结果对比中布尔值和空值结果比较问题 (#2967)
  • 修复Graph知识图谱文档加载错误问题 (#2966)
  • 修复知识图谱的参数丢失问题 (#2926)
  • 修复通过环境变量配置数据源时的错误 (#2924)
  • 修复Milvus向量数据库在工作流中使用错误 (#2933)
  • 解决 AWEL 工作流多窗口问题和应用信息丢失 (#2944)

🛠️其他

  • 更新文档中的一些书写错误 (#2964)
  • 调整benchmark问题集文件 (#2940)

✨官方文档地址

英文:

http://docs.dbgpt.site/docs/overview

中文:

https://www.yuque.com/eosphoros/dbgpt-docs/bex30nsv60ru0fmx

✨致谢

🎉新贡献者

V0.7.5 版本新增 5 位 新的贡献者:


@Hikomorebi

@ZhikunZheng

@lusains

@zhangyj21-lh

@ymx10086

🔥🔥感谢所有贡献者使这次发布成为可能!


@Aries-ckt, @Hikomorebi, @ZhikunZheng, @chenliang15405, @dusx1981, @huhao0926, @liuhill, @lusains, @yaoyifan-yyf, @ymx10086, @zhangyj21-lh and alan.cl



✨附录

快速开始

Docker 快速部署


相关文章
|
存储 SQL 人工智能
Deepinsight x ChatBI:个人Agent助手养成计划
✨一文详解Deepinsight x ChatBI个人Agent助手养成计划
|
27天前
|
机器学习/深度学习 SQL 人工智能
别再群发拜年消息了!三步微调AI,让它学会你的“独家语气”
每逢春节,通用AI祝福总显生硬空洞。本文探讨如何通过微调(LoRA),将“人情世故”转化为结构化数据(称呼/关系/细节/风格等),让AI真正学会你的语气与记忆,生成有温度、带梗、专属的个性化祝福——技术不是替代表达,而是帮你把来不及说的情意,说得恰到好处。(239字)
274 16
别再群发拜年消息了!三步微调AI,让它学会你的“独家语气”
|
27天前
|
安全 C++
关系记忆不是越完整越好:chunk size 的隐性代价
本文揭示关系型RAG(如祝福/道歉生成)中一个反直觉真相:关系信息并非越完整越好。大chunk会将“可引用的触发点”异化为“需总结的材料”,诱使模型转向安全、抽象、概括性表达,丧失走心感。核心原则是——切分重在“可被直接引用”,而非“逻辑完整”。
|
24天前
|
弹性计算 安全 应用服务中间件
阿里云服务器如何部署安装LNMP程序环境?超简单,看完就能上手!
本文详解阿里云ECS部署LNMP环境的两种方式:一是通过系统运维管理控制台“一键安装”扩展程序,快速完成部署;二是手动安装Linux+Nginx+MySQL+PHP,支持Alibaba Cloud Linux/CentOS/Ubuntu,满足WordPress等对配置与安全的定制化需求。含完整步骤、命令及验证方法。
|
27天前
|
监控 测试技术 持续交付
大模型测试怎么做?从模型评估、幻觉检测到 RAG 系统测试全指南
本指南系统讲解大模型测试全流程:涵盖多维度评估(私有评测集构建、指标选择)、幻觉检测(事实核查、一致性与对抗测试)、RAG分层验证(检索/生成/端到端),以及持续集成实践与避坑指南,助力团队落地可靠评估体系。
|
27天前
|
监控 安全 测试技术
GPT-4o 下线 24 小时:3 类线上问题会集中爆发
2026年2月13日起,ChatGPT将退役GPT-4o等旧模型,企业用户可延用至4月3日;API暂不变。此举倒逼测试从业者的模型生命周期管理、行为回归、风格可控性验证及合规边界测试能力升级——大模型正从“稳定依赖”变为“动态运行时”。
|
8天前
|
SQL 人工智能 自然语言处理
我用DataClaw打造了一个7X24小时的数据助理
阿里云DMS DataClaw是7×24小时AI数据助理,支持自然语言提工单、智能巡检、多任务编排、SQL风险预审等9项硬功能,原生集成DMS安全体系,覆盖MySQL/Oracle等60+数据源。现在可免费试用,快来体验吧。
434 9
|
3月前
|
自然语言处理 算法 数据可视化
DeepInsight x ChatBI:“智能歧义识别+知识沉淀”,化解模糊查询
本文针对自然语言数据分析中的语义歧义问题,提出“智能澄清-知识沉淀-动态召回”闭环方案,通过精准识别、最少提问、结构化留存用户意图,实现一次澄清、长期复用,显著提升查询效率与体验一致性。
|
18天前
|
存储 弹性计算 Linux
2026年阿里云服务器购买攻略:三种核心购买方式对比与实操指南
阿里云服务器提供快速购买、自定义购买和活动购买三种方式,适合不同场景需求。选购前需综合考量业务场景、成本策略、地域选择及安全合规。快速购买适用于基础配置速购,提供基础、标准、专业、增强四类套餐,匹配个人开发、企业官网、电商平台等场景,并需注意镜像选择(如Alibaba Cloud Linux性能优化)、带宽计费模式(固定带宽、按量计费、共享带宽包)及完整购买流程。
|
27天前
|
缓存 人工智能 自然语言处理
Prompt 缓存的四种策略:从精确匹配到语义检索
本文详解Prompt缓存四大策略(精确匹配、规范化、语义相似、分层架构),直击LLM应用成本痛点——重复调用导致API费用飙升。代码示例+架构图,助你低成本提升命中率,降本30%–90%,延迟同步优化。
125 11
Prompt 缓存的四种策略:从精确匹配到语义检索

热门文章

最新文章