Dataphin是瓴羊旗下的智能数据建设与治理平台,是阿里巴巴多年内部数据建设与治理实践及方法论的产品化输出,致力于通过一站式智能化的数据建设及治理能力,帮助企业构建起生产经济、质量可靠、安全稳定、消费便捷的企业级数据资产。
一、智能化版本重点特性详解及应用场景示例
特性 1:智能代码助手,随身SQL专家,提供沉浸式的丝滑编码体验
应用场景:
- 公司刚刚上线了最新的StarRocks引擎,刚刚毕业的ETL工程师林小美需要经常查找StarRocks的语法和函数,官方文档示例少,社区的讨论又不成体系而且很难找到完全匹配的话题。
- 编写SQL计算任务代码时,需要频繁查看所使用表的信息,比如某个字段的枚举值的含义和分布情况。编码思路不连续,磕碰式编码。
- 编写SQL计算任务代码时,有时需要写大量重复的,模式类似的片段,比如对多个字段应用逻辑相同的 case when。纯体力劳动,亟需效率改善。
功能概览:
- 可以对话式咨询 SQL 编码相关的问题
- 在对话中,@表(支持多个表)后,描述计算逻辑,将使用指定的表生成相应的 SQL
- 编写 SQL 代码时,将根据上下文(包含注释),提供代码建议,按 Tab 可快速接受
特性 2:智能运维助手,助您随时随地、轻松运维
应用场景:
- 小亮是数多多公司的数据负责人,团队最近在负责一个核心项目的数据产出。上班路上,小亮想查看核心项目的任务运行状态,有什么办法吗?
- 小王是核心项目的开发成员之一,忽然收到任务运行失败的告警。这个任务昨天还好好的呢,怎么今天出错了呢?电脑不在手边啊,可如何是好?
- 小明是核心项目的业务成员,他每天需要用更新后的数据做汇报,如何快速知道这个表数据是否更新了呢?
功能概览:
支持在钉钉中通过配置的方式为组织开启移动运维助手,提供如下能力:
- 全局任务运行概览,快速了解任务运行进度及异常概况
- 失败任务智能诊断,根据运行日志智能分析错误根因并推荐解决方案,同时提供一键重跑
- 快速分析任务告警原因,并一键免打扰
- 查询表数据更新情况、指定任务的运行状态
第一次进去的图片 |
快捷指令 |
告警智能分析 |
|
|
|
特性 3:智能分析,你的“数据翻译官”
应用场景:
- 临时取数需求:快下班了,数据分析师小王却突然接到了明天一早就要给出结果的新任务:本季度管理费用比上季度多的团队有哪些?小王在资产目录找了一圈没有现成的可用数据,找 ETL 帮忙开发也来不及了,怎么办呢?
- 探索式自助分析:业务运营小美想分析下自己负责跟进的产品线最近半年的营销活动投入和增长情况,但是不太会写 SQL,如果能像聊天一样说说话就问到数据就好了
功能概览:
Dataphin 全新推出基于分析专辑的“智能分析”Agent,面向数据产品经理/运营等有基本 SQL 能力的人员,无需熟知SQL 语法即可快速获得取数 SQL,结合模型生成的代码解释,可快速理解查询逻辑并判断是否符合分析需求,一键执行快速获取相关数据,减少重复取数的人力成本、加速释放数据价值。
- 支持构建“智能分析专辑”:可按分析场景聚合一组相关资产,让大模型聚焦少部分精选资产,并结合相关语义信息(如字段说明、指标口径、值域范围、样例数据等,Dataphin模型关系等)和样例数据进行思考,帮助明确数据含义、了解数据内容,从而提升对数据的理解深度。此外:
- 支持配置专辑“示例问题”,引导专辑使用者“学会”问问题
- 支持配置“示例代码”,为模型提供教科书,引导生成符合预期的 SQL
- 支持配置模型“提示词”,类似给大模型的“小纸条”,告诉模型你的查询习惯或增加思考提示,从而控制SQL生成逻辑
- 支持配置基于专辑分析时执行SQL 使用的计算资源,数据获取畅通无阻
- 支持配置专辑的可用人员,按分析场景和团队分工清晰划分,有效保护敏感数据
- 支持基于分析专辑,使用自然语言进行查询取数:根据分析需求选择合适的可用专辑,用自然语言输入问题,大模型将结合专辑包含的数据资产信息,配合示例代码、业务知识、提示词等,快速产出清晰直观的查询 SQL
- 清晰直观的交互体验:左侧保留对话记录,右侧展示生成的 SQL 代码和查询结果;支持切换查看多次问答生成的结果,可快速定位关键信息
- 可快速浏览专辑信息:支持一键点击示例问题进行问答,也支持快速浏览专辑包含的数据信息以便了解可用数据概况,数据触手可及
- 支持多表关联、复杂查询:在专辑配置的可用数据范围内,结合内置的引擎语法知识,支持多表关联、嵌套查询、条件逻辑等复杂查询场景,满足不同的分析需求
- 支持多轮问答,自动保存上下文记忆:结合前文信息准确进行意图理解并生成查询语句
- 支持自由编辑生成的代码:支持直接编辑模型生成的 SQL,无法满足分析需求的场景下,可快速修改达到预期结果
- 可一键执行取数:在有数据查询权限的前提下,可直接执行 SQL 查看结果,实现便捷取数
二、总结与展望
下个版本中,Dataphin 将在开放更多智能化能力,智能ETL、智能标准助手、智能安全助手、智能资产稳定等敬请期待!