一、析言 GBI :以对话式交互改变企业数据分析方式
本次主题是析言 GBI 的产品由阿里云百炼飞天实验室的产品经理李诗琪。在接下来的分享里分享,分别介绍析言 GBI 是什么,以及析言 GBI 最新的产品介绍以及阿里云析言 GBI 目前带来不同的版本,最后将为大家带来新的产品能力的预告。
在大模型时代来临之前,企业去做数据分析,数据分析是企业经营链路里至关重要的环节。传统的数据方数据分析经常会面临着一线的业务变化快,数据分析的门槛高,而企业的毕业分析师资源非常有限,排期非常滞后,为此做定制报表的成本会非常的大,那么企业在日常的数据分析里经常会面临着以上诸多的烦恼。在大模型来临的时代,析言会通过问答式的交互,能够帮助企业在完整的数据分析的链路里做到智能化的升级。
无论是企业的一线的业务员、运营以及企业的管理者,都可以通过自然语言的方式与析言产品去进行完整的交互,在中间无需一行代码,将整个的复杂的理解分析的过程都交给析言GBI去执行。
接下来将会通过一个短片带大家认识析言GBI。
析言GBI是阿里云百炼官方推出的一款基于 AI 原生的数据分析产品,通过自然语言交互实现 NL2SQL 、数据问答、分析洞察等多维度的智能数据分析,登陆阿里云百链应用广场,进入析言 GBI 连接数据源,配置数据信息即可体验对话式问题、输入查询过程解析、业务知识注入、智能分析生成、上传excel表格,即刻进行数据问答,数据预览、提交问题,输出结果。析言支持 MYSQL 、 POSTGRE 协议等的多种数据库及 excel 表格类型数据源对接,与阿里云 ADBPOSTGRE 、HOLOgres、同时支持公网访问数据库与云上 VPC 访问数据库两种网络访问类型,析言支持业务知识自运营,帮助模型更好理解业务语言,欢迎使用析言 GBI 开启智能数据分析。
二、析言 GBI 全新产品发布
接下来是析言 GBI 最新的产品能力。析言 GBI 依托于阿里云百链平台,是阿里云官方推出的一款原生的基于 AI 的大模型数据分析应用,有丰富的数据源管理的能力,可以去对接云上的POLAR、ADB 、以及hologres 。云上数据库的能力会通过公网和VPC 两种访问方式带来云上数据库的连接方式。
以及用户在非云数据库的MYSQL 和PG协议的数据库,接入了丰富的数据源的管理,在上层提供了丰富的多智能体以及工具能力,通过关联的各类型的数据源的连接,会提供任务规划的智能体、数据分析的智能体、数据查询的智能体选表以及生成可视化这样的能力。
通过丰富的智能体的能力,向上层去输出智能的改写、选表AI to SQL 单表问答以及多表联合查询,最后会依据查询的结果做智能的图表生成以及总结的分析。
接下来会介绍析言的技术架构,基于 Muti-Agent 工程链路的架构,析言整个的产品是如何去工作的?
如果今天为自己招聘一位助理,尽可能希望他不犯错误和少犯错误,需要把注意事项提前告知,这套逻辑对于 AI 模型来说依然如此。这张图从下往上看,在开始简单的数据问答前,在离线链路也要经过一系列的准备工作,在企业的用户可能沉淀了数量庞大的冗余的相应的各类型的数据表,所以为了让模型更好的去理解所有的数据的行为以及业务的行为,尽可能的希望能够先去做表的治理和宽表的加工,以及业务语言里可能会有非常复杂的行业特有术语,以及企业特有的业务知识,也希望能够去做业务知识的构建,析言会提供丰富的 DB 组件,能够去对接云上以及客户在本地的各类型的数据库。在做好数据的离线列入的管理与治理之后,会在离线的链路里会依据表列值三级的预取结构,将所有的数据的知识去进行向量化的存储。
在离散链路做好相应的数据接入后,一线的业务人员可以非常轻松的通过对话式问答的能力达到数据分析结果,现在看这张图的上方的在线链路,从用户来调用析言的产品开始,只需要通过一句自然语言的问题,在析言接收到这个用户问题后,就会根据当前用户他的上下文的问题去做历史的记忆。在这个过程中,会提供多轮对话的能力,去更好的去理解用户当前的问题和上文的问题是否有相关性。
在做好用户问题的理解后,会去做整体问题的改写。在改写的环节,会根据这个问题的复杂度去做相应的任务的拆解。在拆解好具体的问题之后,会有一个 Planner ,是任务规划的智能体态去规划整体任务的执行。在进入到下一个阶段,整体的选表和召回,析言会提供不同的版本,不同的版本的链路之间也会有些许的差异。
做好了问题的理解,知道用户这一次是想做什么问题的分析时,现在就去找目标对应的数据源,会提供丰富的数据源的业务理解的方式,比如同义词的召回、企业知识名词、业务逻辑指标定义口径等等的召回,以及在离线链路里预先做好的向量化存储的表列值的三级召回,在整个的过程中会去做所有数据源与问题相关的精选的表格,在做好了数据源的选取后,接下来会去做数据的查询,这一步骤对于NL to SQL 这个领域也至关重要。
在整个的领域里会依据用户的问题,以及检索到的业务的知识,选取到的数据源,在这个过程中去做查询本条语言 SQL 语句的生成。在 SQL 语句生成后,会有完整的校验的丰富的链路,尽可能的来保障生成的 SQL 语法的准确性以及可执行性。
在做好所有的数据查询后,从数据库里拉取这一次查询所有的目标数据,在最后会根据这个问题的特性,以及查询到的这个问题的呈现的特征,去做整体的可视化的图表生成以及结合这个问题的智能分析的结果。根据问题的特性,以折线图饼状图和柱状图的方式,去展现此次的分析结果。在整个过程的链路中,会涉及到模型回流的数据和用户反馈的数据,拿到的回流数据会在离线进行模型迭代的优化,确保模型在理解业务员后,还能有一个源源不断的提升迭代的效果。
整个析言产品在数据源的多样性,连接方式的多样性和部署的灵活性上面有三大重点的优势,将分别介绍。首先看数据源的多样性。架构里有看到整个析言是可以连接云上的数据库,本地的数据库,包括可以去上传 excel 表格的方式去轻松的开启即刻的问答,在整个的数据源连接的方式上,也可以通过GDB BC的方式去访问公网数据库, VPC 的数据库,也可以通过云上提供的电台 DATA API 方式来访问阿里云 ADB PG 的数据库。
部署的灵活性上,析言提供整个的公网访问的部署模式以及公网加本地数据库部署的联合部署的方式,能够灵活的去适配不同数据安全等级需求的用户的一套部署需求,同时在上层也会提供对话API 的能力,能让用户比较灵活的将析言的问答式的能力集成在的端侧,比如集成在自己CI 的系统里能让一线业务员以非常轻松的入口来唤起 CHAT BI 问答。
产品的应用性,析言去提供4个高效可信应用的交互,首先对话式的交互,其实就改变了传统的数据分析的像 BI 部门去描述需求,去撰写需求报告目标,希望获取的数据方式,这种冗藏的数据链路,会通过对话式的交互整个在智能化的链路上去做提效。第二是业务知识的注入,每一家客户每一个部门甚至每一个细小的业务可能都会有指标定义或者是口语化这样等等的业务的知识,那么会通过刚才介绍到的各类型的业务知识的管理,能够让模型,让 AI 产品能更能够容易的去理解在自然语言表达过程中的口语化的、业务化的指标,能够让模型工作的更加的精准。
第三是查询过程的解析,析言在接收到用户的问题,并且去执行一系列的分析和查询的结果当中,会把每一个步骤执行的结果能够流式的在页面输出回来,这样的方式就能够帮助用户非常有效的去检验模型推理,那整个的过程都是有据可循的。
最后在整个 chat 的过程中,会提供丰富的智能图表生成的能力,每一个问题无论是查趋势、查分布、去查占比,会根据这个问题的复杂度以及这个问题呈现的形式,去选择对应的生成图表,把数据能够更直观的呈现出来,让一线业务员能够很快的拿到数据分析的报告,并且在 chat 的一个聊天窗口里,本次生成的报告也能够快速的下载到本地,能够极大的去减少业务员去制作报表,然后把不同的问题去生产加工成报表的这样的链路。
技术方面,析言的技术的领先性目前在9月份依然蝉联了在业内 TOP 榜单的第一名。看整个基于析言的架构的技术优势。首先在对话的过程中,采用了基于上下文和任务记忆的多轮对话的能力,在这个能力里其实能够丰富的去理解用户本次丢失的信息以及补充的信息然后其次去理解问题的时会提供基于领域和问题两个阶段的改写会更懂行业和业务的逻辑。最后高精度的 SQL 生成,并且也提供了丰富的校验方式,能够保障高执行的准确率。
析言在整体的技术链路里首次去首创业内 M-Schema 数据结构,相较于传统的 DDL ,还有包括 index 的模式,这种模式会非常的紧凑,而且能够去兼容更多的方言以及语法,包括整体的业务逻辑的注入,更好的去影响 SQL 的生成,让SQL 更规范、更精准更业务,包括对于模型理解不好的案例,也提供了 ICL 的案例库的方式,能够让模型自学习,从而去优化整体的生成效果。
三、析言 GBI 产品版本介绍
接下来介绍,析言目前商业化的三个版本,会提供两个标准版本,标准版的 Turbo 和 mix ,以及一个定制化的版本。在提供的标准化版本里,析言在整个数据分析领域去做过特殊微调定制的一套模型,在的定制版的 Turbo 里,基于用户自有的数据去做一对一的模型定制,这样可以更贴合高度复杂的业务场景,不同的版本,我在模型的精度、准确率以及端到端响应时长上都有不同的侧重,这样可以方便不同业务需求和规格的客户来自行的选择。
四、析言 GBI 产品能力预告
最后将为大家介绍即将发布的动态规划的 BI 分析的能力,在这一套动态规划的 BI 分析能力,析言能够理解更复杂的、更抽象高层的 BI 信息的一套系统,将会通过一个短片带大家了解。
动态规划的分析能力即将发布。析言根据目标问题复杂度自动拆解分析任务,根据每个分析任务进行数据查询及结论总结。根据已执行的任务结果,智能规划下一步任务执行,根据已查询各项信息,智能生成综合分析报告,欢迎使用析言 GBI 开启智能数据分析。
基于动态规划的 BI 分析能力,将在下个月去推出,也欢迎大家持续的关注以及试用析言产品。
最后大家可以通过阿里云百炼的应用广场来访问析言的产品,将会为每一位用户提供两百个免费问题的额度来供大家做测试。接下来将分别为大家介绍云上的数据库和析言联合推出的联合产品解决方案。