阿里云百炼|析言GBI产品入门指导

简介: 析言基础入门的操作体验,带领大家一起探索阿里云百炼|析言GBI的奥秘。

1. 产品简介

析言GBI是基于阿里云通义大语言模型在数据分析领域专门增强的原生数据助理,通过自然语言交互实现NL2SQL、数据问答、分析、洞察等多维度的大模型智能分析应用,适用于业务变化较快、数据分析时效性强的一线业务场景。点此访问析言GBI控制台

2. 快速体验

在不关联自己数据库的情况下,有2种方式可以快速体验析言的各项能力。

方案1:直接使用官方预置的数据库以及样例问题,也可以参考官方数据库的配置方法。

方案2:上传本地的excel测试数据,针对excel的数据进行问答。

image.png

3. 开通百炼,进入析言控制台

首先,访问阿里云百炼官网,并参考文档开通阿里云百炼大模型服务产品, 开通阿里云百炼的云产品服务。开通完成后,进入阿里云百炼控制台 > 应用广场 > 官方应用 > 析言GBI。点击“立即体验”即可进入析言控制台页面。

析言GBI为每个客户提供200个问题的免费试用额度。超出免费额度后,如需继续使用,请按需购买产品规格。

3.1 数据库连接

目前数据库提供了两种方式,一种是预置的官方数据库,一种是自定义数据库。

官方数据库

1)首先,进入析言控制台,点击“使用官方预置数据库”,直接会进入提问界面。


2) 然后,在下方输入框中单击“鼠标左键”,会显示预置的推荐问题,可选择任意一个问题开启对话,进行体验。


3) 如果需要查看预置官方数据库相关的数据表信息,可以在左侧导航栏点击“数据表管理”,再单击“官方数据库”中的“查看详情”可以查看官方预置数据库中的数据表。

官方预置的数据库包括三张数据表:消费者信息表(customers)、订单信息表(orders)以及商品信息表(products)。您可以查看各数据表字段及其表内容。


4) 进入官方预置数据库中的数据表后,可以看到对应数据表,点击“查看详情”,可以查看数据表详细信息。点击“查看企业数据配置”,可以看到对应的配置信息。

5) 进入单个数据表内后,可以看到数据表内的列名,列信息等表内的具体信息,点击右侧的“预览数据表”,可以预览整个数据表的信息。

自定义数据库

1)首先,进入析言控制台,点击“前往数据管理”,会进入数据表管理。

2) 进入数据表管理之后,会显示两种访问方式,一种是访问公网数据库,一种是访问VPC数据库。

3) 访问公网数据库,可连接MySQL或PostgreSQL数据库,点击“授权联接”,会弹出联接窗口页,按照要求进行填写即可。

连接时,需填写数据库实例IP/域名为公网可访问的地址,这里的数据库IP/域名可以是您在阿里云购买的云上数据库地址,或本地机房的数据库服务地址。如果遇到连接失败的情况,请检查数据库访问是否有IP白名单限制。如有限制,请在白名单中添加析言GBI的IP地址:39.107.142.91。

填写格式:例如IP:rm-xxxxxx.mysql.rds.aliyuncs

  • 注意:开头和末尾不能留有空格。

4)在VPC访问数据库中连接AnalyticDB PostgreSQL前,需要先“授权ADB实例”。若未进行ADB实例授权,则在授权ADB实例弹窗中,点击授权联接按钮会先进行ADB实例授权。执行此操作会自动创建一个服务关联角色。

该权限将允许阿里云百炼析言GBI访问您的云原生数据仓库 AnalyticDB PostgreSQL版资源,使用该权限可查询数据库、表、列等信息,执行SQL查询数据相关功能。

授权ADB实例后,需要填写表单,授权析言GBI连接您的ADB数据库。

  • Region:必填,可选范围有北京、上海、杭州、深圳等,默认北京。
  • 数据库实例:必填,Region范围内的数据库实例,仅支持选择一个实例.
  • 用户名和密码:必填,访问已选ADB数据库实例的用户名和密码。

5)在VPC访问数据库中连接Hologres、MySQLPostgreSQL 数据库前,用户VPC与析言VPC需进行网络层面打通。

打通网络的具体操作,请参见反向网络访问VPC打通。网络打通后,请填写关联数据库信息进行数据库关联。

6)连接数据库成功后,选择授权析言GBI访问的数据表信息,以完成数据表同步。当数据库中存在大量数据表时,此数据同步过程可能需要更多时间。数据表同步成功后,您可在页面列表中进行管理。

7)当您需要在自定义数据库和预置数据库进行切换时,可以点击右下角的“重置对话”,会跳转到析言首页,在首页右上角点击“更换自定义数据库”,即可选择自己需要联接的数据库类型进行联接。

3.2 数据表管理

1) 数据表同步成功后,为使析言GBI能正常接入,需要您在数据表管理维护该表的schema信息,同时确保和源数据库的结构一致。您可点击“管理”进入数据表详情页进行查看。

2) 进入后,数据表的基础信息包含:数据表描述、数据表的主键、外键信息。您可以点击“基础信息”进行对应的修改。

  • 数据表描述:当前表记录的数据内容与颗粒度等,例如:变电站安装记录表,用于xxxx;
  • 数据表主键:用于保证数据完整性,即确保在该表格中每一行记录都是独一无二的,用来快速查找和引用特定记录;
  • 数据表外键:在不同表之间建立联系,用于跟其他表格进行关联;例如: 表a.列名=表b.列名1;表之间若有外键,必须配置,否则表格之间join可能有误。

                               

3) 数据表内的字段信息,可以点击“编辑”,进行设置。包含:列中文名,列描述,数据类型,枚举值,数据取值范围等信息。

  • 列描述:用简单凝练的语言描述该列的具体含义;
  • 列中文名:选填,在列描述信息缺失的情况下,根据列中文名理解数据表信息;
  • 枚举值:对于枚举类型的列至关重要,需要罗列该列中存储的全部值,在有值含义映射的情况下,需为值设置其对应的映射值。可通过从数据库中同步枚举值来便捷操作,析言将从数据库中拉取去重后的至多99个枚举值。有一些关键的要求和最佳实践需要注意,以确保其有效性和可靠性:
  • 值的唯一性:每个枚举值应该在预定义的范围内是唯一的,不能有重复的值。
  • 值的描述性:枚举值应尽可能具有描述性,这样能够直观地表示其含义。例如,用 'active' 和 'inactive' 比 1 和 0 更具可读性。
  • 合理的值数量:枚举值的数量不宜过多,过多可能会增加代码复杂度和维护成本。一般建议控制在10个以内。


3.3 企业数据管理

为了帮助析言GBI更好地理解您在数据分析中的目标表述,企业数据管理模块提供了三种工具,可以满足您的业务场景需要。

知识名词解释

有一些名词是非数据库表内的,而是业务场景的专有名词,例如:在使用自然语言提问时,通常会出现“咨询转化率”一词,但关联数据表中并没有“咨询转化率”列,其值是经“有咨询且下单成功客户”列汇总后,与“有咨询客户”列汇总的结果相除获得。对于这种情况,您可以在该词条描述下定义该指标的计算口径。

1) 您可以点击“编辑”,定义该专有名词的计算模式。

2) 您也可以点击“批量操作”,进行批量下载,添加,删除的操作。

同义词解释

使用自然语言提问时,经常涉及某个词汇的多种说法,这些说法被称为同义词。例如:数据表实际存储值为“北京市”,在使用自然语言提问时,可以使用同义词“首都”来替代。您可以在同义词解释中配置常见表述中涉及到名词及其同义词。

1) 您可以点击“编辑”,配置对应名词及其同义词。

  • 为提升同义词识别准确度,建议在配置同义词时,将同义词关联到数据表具体的某一列上。

2)您也可以点击“批量操作”和“新增词语”,进行批量下载,添加,删除以及同义词新增的操作。

业务逻辑解释

企业特有的业务逻辑通常需要配置在业务逻辑解释中。例如,当查询包含“本月”时,您可以将业务逻辑解释配置为“指从本月1日至今天的数据汇总”。能让模型更好的理解这些业务逻辑并进行处理。

业务逻辑分为全局和智能两种。全局型业务逻辑对所有用户的问题生效。智能业务逻辑由模型根据用户问题内容选择性生效。

1) 您可以点击“编辑”,配置对应业务逻辑解释及其类型。配置完成后,点击“保存”即可

2)您也可以点击“批量操作”和“新增逻辑解释”,进行批量下载,添加,删除以及业务逻辑新增的操作。

3.4 优化方式

模型优化案例管理(仅支持mix版本)

在尝试调整问题问法及数据管理后,模型依然无法输出预期结果的情况下,您可以通过添加优化案例来指导模型进行学习。

优化案例管理提供通配符管理与案例库管理两项能力,其中通配符需与案例库联合使用,请先添加通配符,而后添加案例库。添加完毕后,系统需要进行数据解析供模型自学习,请稍等几分钟后再使用。

通配符管理

通配符是一种可以被一个或多个字符进行模糊替代的高级词汇,例如某通配符A为【职级】,其枚举值为“初级工程师”、“中级工程师”、“高级工程师”。在实际问题问法中可能包含某个通配符的某个枚举值,此类问法在后续进行案例管理时,无需为每个枚举值逐一添加案例,模型将根据通配符的设置内容进行智能理解。

案例库管理

一条案例包含一个问题的问法描述与其预期正确执行的完整SQL内容。在设置案例时,若该案例的问法描述中包含某通配符的某个枚举值信息,请确保已在通配符管理中完成设置。这种方式可以有效提升模型解决一类问题的准确率。

模型输出干预

对于多次尝试调整问题问法及数据管理后,模型依然回答错误的案例,您可以通过设置特定回复来干预模型输出。

  • 为避免设置过多干预条件产生不可预知的负向影响,请谨慎设置干预条件,并尽可能减少该功能的使用频率。

                                             

4. 问答过程

4.1 输入问题

1) 连接完成数据库后,您可以在析言首页输入框内输入您的问题,点击提交。

2) 问题提交后,析言GBI将按照五个步骤解析您的问题并生成相应答案。

3)针对生成的答案您可以执行以下操作。

【重新生成】

当点击重新生成问题答案时,原答案会保留,可以在卡片底部进行切换查看,默认停留在最近一次生成结果页。

  • 目前析言重新生成,最大次数可支持生成5次。

【图表切换】

在图表输出的上方会显示可点击切换的图表类型,目前有柱状图、折线图、饼图三种方式,输出类型默认点亮,点击其他类型可重新进行绘制。

  • 注意:切换图表改变的是展示形式,不会重新生成结果。

【结果导出】

结果生成结束后,支持导出。可点击“下载结果”,把本次问题及析言GBI生成结果下载至本地。

下载文件格式:.csv。

下载文件名称:Request ID.csv。


👉具体使用请参考析言GBI使用指南


如您在使用析言GBI的过程中有任何问题,欢迎加入钉钉群咨询、交流和反馈。加入钉钉群的方式:您可以使用钉钉扫描如下二维码,或搜索钉钉群号:94725009401。

作者介绍
目录