DB-GPT v0.6.0 版本更新,发布六大核心新特性!

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: DB-GPT v0.6.0 版本已发布,这是一个开源的AI原生数据应用开发框架,带来了多项新特性,包括AWEL协议升级至2.0,支持复杂编排;改进的数据应用创建与生命周期管理,支持多模式构建;GraphRAG增强图社区摘要与混合检索,图索引成本降低50%;丰富的Agent Memory类型;支持Text2NLU与Text2GQL微调;GPT-Vis前端可视化升级。这些更新助力企业快速构建智能数据应用,推动数字化转型。


亲爱的 DB-GPT 社区伙伴们,DB-GPT v0.6.0 版本发布啦,接下来我们一起看看该版本带来哪些变化吧:

版本介绍

DB-GPT是一个开源的AI原生数据应用开发框架(AI Native Data App Development framework with AWEL and Agents),在V0.6.0版本中,我们进一步围绕大模型提供灵活、可拓展的AI原生数据应用管理与开发能力,可以帮助企业快速构建、部署智能AI数据应用,通过智能数据分析、洞察、决策,实现企业数字化转型与业务增长。

新特性

  • AWEL协议升级2.0, 支持更复杂的编排

  • 支持数据应用的创建与生命周期管理, 支持多种模式构建应用, 如: 多智能体自动规划模式、任务流编排模式、单一智能体模式、原生应用模式

  • GraphRAG支持图社区摘要与混合检索,图索引成本相比Microsoft GraphRAG降低50%

  • 支持丰富的Agent Memory,如感知记忆、短期记忆、长期记忆、混合记忆等

  • 支持意图识别与Prompt管理,新增支持Text2NLU与Text2GQL微调

  • GPT-Vis前端可视化升级, 支持更丰富的可视化图表

特性说明

1.AWEL协议升级2.0,支持更复杂的编排,同时优化了前端可视化与交互能力。

AWEL(Agentic Workflow Expression Language) 是一套专门为大模型应用开发设计的智能体工作流表达式语言,提供强大的功能和灵活性。通过AWEL API开发者可以专注于大模型应用逻辑开发,不需要关注繁琐的模型、环境等细节。在AWEL2.0中,我们支持了更复杂的编排与可视化。
image.png
image.png

2.支持数据应用的创建与生命周期管理,支持多种模式构建应用, 如: 多智能体自动规划模式、任务流编排模式、单一智能体模式、原生应用模式。
image.png
image.png
image.png
image.png

3.GraphRAG支持图社区摘要与混合检索,图的构建与检索性能相比社区方案有明显优势,且支持炫酷的可视化。GraphRAG是基于知识图谱的增强检索生成系统,通过知识图谱构建与检索,进一步增强检索的准确率与召回的稳定性,降低大模型幻觉的同时,增强领域应用的效果。DB-GPT结合TuGraph,构建了高效的检索增强生成能力。
image.png

基于DB-GPT 0.5.6版本推出的融合向量索引、图索引、全文索引的通用RAG框架,DB-GPT 0.6.0版本针对图索引(GraphRAG)做了能力增强,支持了图社区摘要与混合检索能力。新版本我们引入了TuGraph内置的leiden社区发现算法,并结合大模型提取社区子图摘要,最终通过社区总结的相似性召回,很好地应对了泛化性提问场景,即QFS(Query Focused Summarization)问题。另外在知识抽取阶段,我们将原先的三元组抽取升级为带点边信息总结的图抽取,并通过文本块历史优化跨文本块关联信息抽取,进一步增强知识图谱的信息密度。
image.png

基于上述设计,我们采用了TuGraph社区提供的开源知识图谱语料(OSGraph)以及DB-GPT和TuGraph的产品介绍材料(共计约43k tokens),并与Microsoft的GraphRAG系统做了对比测试,最终DB-GPT仅消耗了相比50%的token开销,便生成了同等规模的知识图谱。并且在问答测试质量相当的前提下,全局搜索性能有明显提升。
image.png

最终生成的知识图谱我们采用AntV的G6引擎升级了前端渲染逻辑,可以直观地预览知识图谱数据和社区划分结果。
image.png

最新版本体验请参考GraphRAG开发手册:http://docs.dbgpt.cn/docs/cookbook/rag/graph_rag_app_develop

5.Agent Memory: 支持了多种记忆类型,如感知记忆、短期记忆、长期记忆、混合记忆等。
image.png

6.GPT-Vis: GPT-Vis是面向LLM与数据的交互可视化解决方案,支持丰富的可视化图表展示与智能推荐。
image.png
image.png
image.png

7.🌟Text2GQL与Text2NLU微调: 新增支持了自然语言到图语言的微调,以及语义分类的微调。
image.png

使用手册

  • V0.6.0中文使用手册

https://www.yuque.com/eosphoros/dbgpt-docs/fho86kk4e9y4rkpd

  • V0.6.0英文使用手册

http://docs.dbgpt.cn/docs/application/

  • 如何升级至v0.6.0

http://docs.dbgpt.cn/docs/upgrade/v0.6.0

致谢

本次迭代离不开广大社区开发者与用户的参与,同时也进一步跟TuGraph与AntV社区进行合作。感谢所有贡献者使这次发布成为可能!

@Aries-ckt, @Dreammy23, @Hec-gitHub, @JxQg, @KingSkyLi, @M1n9X, @bigcash, @chaplinthink, @csunny, @dusens, @fangyinc, @huangjh131, @hustcc, @lhwan, @whyuds, @yhjun1026 and @yunfeng1993
image.png

附录

01 DB-GPT 框架

https://github.com/eosphoros-ai/DB-GPT

02 Text2SQL 微调

https://github.com/eosphoros-ai/DB-GPT-Hub

03 DB-GPT 前端可视化项目

https://github.com/eosphoros-ai/DB-GPT-Web

04 DB-GPT 插件仓库

https://github.com/eosphoros-ai/dbgpts

05 Text2SQL学习资料和前沿跟踪

https://github.com/eosphoros-ai/Awesome-Text2SQL

06 中文官方文档

https://www.yuque.com/eosphoros/dbgpt-docs/bex30nsv60ru0fmx

07 英文官方文档

http://docs.dbgpt.site/docs/overview

自媒体发文-底部引导图.PNG

相关实践学习
基于EMR Serverless StarRocks一键玩转世界杯
基于StarRocks构建极速统一OLAP平台
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
1月前
|
人工智能 Rust Apache
|
4月前
|
存储 SQL 数据库
Python 金融编程第二版(GPT 重译)(四)(4)
Python 金融编程第二版(GPT 重译)(四)
49 3
|
4月前
|
存储 NoSQL 索引
Python 金融编程第二版(GPT 重译)(一)(4)
Python 金融编程第二版(GPT 重译)(一)
61 2
|
4月前
|
索引 Python
Python 金融编程第二版(GPT 重译)(二)(4)
Python 金融编程第二版(GPT 重译)(二)
31 0
|
4月前
|
存储 SQL 数据可视化
Python 金融编程第二版(GPT 重译)(二)(3)
Python 金融编程第二版(GPT 重译)(二)
44 0
|
4月前
|
存储 机器学习/深度学习 关系型数据库
Python 金融编程第二版(GPT 重译)(四)(5)
Python 金融编程第二版(GPT 重译)(四)
35 2
|
4月前
|
存储 SQL 数据可视化
Python 金融编程第二版(GPT 重译)(四)(1)
Python 金融编程第二版(GPT 重译)(四)
46 2
|
4月前
|
数据可视化 Python
Python 金融编程第二版(GPT 重译)(三)(4)
Python 金融编程第二版(GPT 重译)(三)
27 2
|
4月前
|
存储 算法 数据可视化
Python 金融编程第二版(GPT 重译)(一)(1)
Python 金融编程第二版(GPT 重译)(一)
88 1
|
4月前
|
SQL 存储 数据库
Python 金融编程第二版(GPT 重译)(四)(3)
Python 金融编程第二版(GPT 重译)(四)
40 1