【产品升级】Dataphin V5.1版本发布:跨云数据集成、指标管理、平台运维带来重大更新!

简介: V5.1版本新增多项功能:对接AWS生态(支持Amazon EMR、Redshift等),强化研发技术支撑(如API认证升级、全量任务隔离),完善运营消费链路(新增业务指标管理、指标关系图),提升平台综合能力(自定义菜单、缩短升级停机时间)。这些功能助力企业实现高效数据治理与分析,未来还将拓展智能化与国际化支持。

image.png

Dataphin是瓴羊旗下的智能数据建设与治理平台,是阿里巴巴多年内部数据建设与治理实践及方法论的产品化输出,致力于通过一站式智能化的数据建设及治理能力,帮助企业构建起生产经济、质量可靠、安全稳定、消费便捷的企业级数据资产。  


一、Dataphin V5.1 版本升级功能点

01- 拓展 AWS 生态,适配AWS计算引擎及数据源

  • 引擎适配:支持AWS EMR作为离线计算引擎
  • 数据源:离线集成、数据服务、全域质量、元数据采集支持Amazon Redshift以及Amazon RDS

02- 强化研发技术支撑,加速企业数字能力建设

  • API数据源支持OAuth2.0认证及自定义签名认证,满足多样化数据接入诉求
  • 增全量一体实时同步支持任务运行隔离,可灵活按照表级别控制同步任务
  • 支持租户级任务运维,打破项目壁垒,你关心的任务尽在手中

03- 完善运营消费链路,完整呈现从需求到实现的全过程

  • 新增“业务指标”管理,助力指标清晰定义和理解一致
  • 新增“指标关系图”让复杂计算逻辑变“透明”

04- 平台综合能力提升,增强平台可扩展性及稳定性

  • 支持自定义系统菜单,构建企业级统一门户
  • 全新升级模式,调度停止时间从3小时缩短至15分钟


二、新版本重点特性详解及应用场景示例

特性 1:对接AWS生态,支持Amazon EMR、Amazon Redshift、Amazon RDS

应用场景:

面向中国出海的企业

  1. 使用Amazon EMR 作为离线计算引擎的客户
  2. 未使用Amazon EMR作为计算引擎,但数据存储在Amazon,可使用Dataphin接入Amazon数据源

功能概览:

  1. 支持AWS云上部署
  2. 支持使用 Amazon EMR 作为离线计算引擎
  3. 支持Amazon Redshift、Amazon RDS for PostgreSQL/MySQL/SQL Server/Oracle/DB2数据源
  4. 功能范围:离线集成、数据服务、全域质量、元数据采集


特性 2:新增“业务指标”管理,助力指标清晰定义和理解一致

应用场景

  1. 从分析需求管理角度:面向业务分析与数据开发人员,业务指标通过标准化管理双向赋能:既作为需求表达载体助力业务人员结构化输出,又通过系统化落地帮助开发人员精准对接需求,从而降低沟通成本、减少开发误差,实现全链路提效。
  2. 从指标查找使用角度:面向资产管理人员(尤其业务侧),基于业务-技术指标的关联体系,可快速了解需求的开发实现与拆解逻辑,沉淀场景化分析知识,助力业务人员快速定位关键指标、驱动精准决策。

功能概览:

业务指标管理能力通过标准化和系统化的方式,在平台上充当业务人员与技术人员的桥梁,确保指标的清晰定义和理解一致,以提高数据分析效率和决策准确性,促进团队协作,减少偏差,增强数据驱动能力。

  1. 支持业务指标定义,包括:名称、指标口径、归属目录、自定义属性、使用说明等信息;支持配置业务指标的可见权限;支持编辑、手动上架/暂不上架、删除等完整的上架管理操作
  2. 支持添加“相关业务指标”,从而可以按场景快速聚合相关指标,并在查询时进行关联推荐

  1. 支持为业务指标添加关联的技术指标,也支持在编辑技术指标信息时添加关联的业务指标

  1. 支持在前台按目录查看业务指标列表与详情、支持混合检索业务指标与技术指标


特性 3:“指标关系图”让复杂计算逻辑变“透明”

应用场景

  1. 业务异常根因分析:核心指标波动时(如月活用户环比下跌15%),业务分析师可通过关系图逐层下钻拆解(MAU→DAU→新增用户/留存率→关键行为转化节点),快速定位异常环节(如某渠道注册流程断裂导致新增锐减),及时给出策略调整建议有效支撑业务。
  2. 指标口径变更推演:业务口径调整时(如复购率计算新增支付成功条件),通过关系图透视指标逻辑层级(复购率→用户购买次数→订单支付状态),明确需同步修改的派生指标(如有效复购率),规避口径迭代风险。

功能概览:

  1. 开发模块创建指标/原子指标时,新增“指标口径”定义:对于衍生原子指标/衍生指标,可通过@快速引用其他指标便于规范化配置

  1. 技术指标上架配置,可开启“指标关系图”的展示,并根据需要选择是否隐藏 SQL 计算逻辑(可一定程度上对敏感指标进行保护)

  1. 技术指标详情可查看“指标关系图”:以可视化的方式清晰地展示指标按照开发逻辑一步步往下拆解的依赖关系,如:衍生指标-->派生指标-->衍生原子指标-->原子指标,便于了解指标的生成过程、加工逻辑,提高数据透明度和可解释性
  1. 开发逻辑透视:逐层展示指标加工规则(聚合/关联/计算逻辑),消除"黑盒计算"隐患
  2. 业务价值传递:用流程图替代技术文档,让运营人员直观理解"会员复购率"等复杂指标的业务构成要素


特性 4:支持自定义系统菜单,构建企业级统一门户

应用场景:面向企业管理员,支持通过自定义系统菜单的方式,在Dataphin的菜单中嵌入企业其余门户的URL。

功能概览:

  1. 支持创建菜单分组,或在已有系统菜单的分组中通过iframe的方式嵌入外部系统的URL;
  2. 支持对嵌入的菜单进行权限管控,灵活控制每个角色的菜单,默认仅超级管理员和系统管理员可查看自定义菜单。


特性 5:全新升级模式,调度停止时间从3小时缩短至15分钟

应用场景:在之前的升级模式中,存在如下不便:

  1. 升级前需要停止掉所有正在运行的任务,同时暂定任务的调度,对于小时任务多的用户存在较大影响;
  2. 系统升级时,产品界面展示404、503错误码,容易造成歧义。

功能概览:

  1. 升级期间提供维护界面,清晰告知用户当前系统处于维护状态;
  2. 正在运行的任务无需终止,且大额缩减调度停服时间,仅需停止15分钟;
  3. 缩短产品不可用时长,仅需维护40分钟

补充说明:

  1. 仅V5.1.1及以后的版本升级到更高版本时可用新版升级模式;
  2. 推出实例运维工具—Dataphin Manager,邀请有自主运维诉求的用户进行自主升级。


特性 6:数据标注“码表”支持直接引用已有表快速创建,一键同步码值数据

应用场景

  1. 码表通常在数仓系统中以“维表”的形式存在,针对已经存在的维表,能否快速将其作为码表使用呢?
  2. 针对主数据系统梳理好的核心表,希望可以快速引用创建为码表,从而保证核心数据的一致性和数据更新时效性,无需重复创建

功能概览:

  1. 码表定义方式新增“从表引入”:支持引用有 select 权限的计算源/已通过元数据采集任务采集到的数据源表作为来源,一键获取指定范围的数据快速创建对应的码表;支持添加过滤条件仅获取需要的数据。

  1. 创建完成后,如有数据更新,可基于引用配置一键更新码值、或手动编辑已获取的码值数据,便于灵活管理。


特性 7:API数据源及管道组件升级,适配多样化认证的API

应用场景:

出于安全合规及业务场景多样化的考量,与企业级 ERP 系统如聚水潭、金蝶等进行 API 对接时,传统静态 Token 及基础认证方式(如固定密钥、简单用户名密码)已难以满足复杂的数据交互安全需求。这类静态认证模式存在明显安全短板,容易在传输过程中被截获、伪造或因系统漏洞泄露。

为了让客户能够更安全的接入API数据,Dataphin5.1支持了两种新的API认证方式。

  1. 一种是基于 OAuth 2.0的动态授权机制,授权服务器验证通过后,颁发短期有效的 Access Token,用于 API 请求认证;
  2. 一种是请求签名认证,通过对每一次 API 请求的关键参数进行加密签名,确保数据完整性与防抵赖性。

功能概览:

  1. API数据源支持OAuth2.0认证,支持API调用时动态获取Token
  2. API输入及输出组件支持支持自定义签名规则,支持根据时间戳、随机数及请求参数使用MD5HEX和HMAC系列函数生成动态签名

 


特性 8:增全量一体新增Hudi入湖支持,并支持表级全量任务运维

应用场景:

  1. 增全量一体任务中,若重新运行单表的全量任务将导致所有表的实时增量任务暂停
  2. 对于实时增量集成的场景是不友好且低效的,可能会增大数据延迟,影响下游业务消费

功能概览:

  1. 支持多表运行隔离,单表运行发生变更不再影响其他表
  2. 增全量一体新增支持MySQL到Hudi,目前增全量一体支持的数据湖有:Databricks、Hudi、MaxCompute Delta


特性 9:租户级统一运维,运维不再分项目隔离

应用场景:

在v5.1版本之前,Dataphin的运维按照项目做了隔离,带来了大量的不便利:

  1. 运维界面操作任务(如: 批量修改优先级),须切换至任务所属项目,频繁切换导致体验下降
  2. 根据任务ID搜索任务,须明确知道其所属项目,否则须逐个切换项目尝试

功能概览:

  1. 运维合并项目,项目作为统一列表的筛选项和展示项


  1. 支持查看同一个依赖路径上任意两个节点间的运行甘特图,帮助评估耗时分布,定位瓶颈问题


  1. 支持修改实例优先级;支持下载实例列表(支持下载筛选结果)


三、总结与展望

下个版本中,Dataphin 将在智能化、国际化时区、Iceberg数据湖、API行级权限、批量补数据等方面进行支持,更多精彩功能,敬请期待!

相关文章
|
2月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
2785 166
|
4月前
|
搜索推荐 数据管理
Dataphin功能Tips系列(70)自定义菜单:构建一站式数据管理平台
Dataphin通过自定义菜单功能,支持嵌入企业其他平台URL,实现统一的数据开发与管理平台,提升团队协作效率。
195 8
|
5月前
|
运维 监控 安全
打怪升级不是梦!运维也能靠“游戏化”高效运转?试试看就知道了!
打怪升级不是梦!运维也能靠“游戏化”高效运转?试试看就知道了!
91 1
|
5月前
|
SQL 运维 自然语言处理
Dataphin智能化重磅升级!编码难题一扫光,开发运维更高效!
Dataphin重磅推出三大核心智能化能力:智能代码助手提升SQL开发效率;智能运维助手实现移动化任务管理;智能分析通过自然语言生成SQL,助力数据价值释放。未来将持续开放智能ETL、安全助手等能力,助力企业构建高效、稳定的数据资产体系。
512 0
|
3月前
|
人工智能 安全 API
Dify平台集成安全护栏最佳实践
Dify平台提供低代码构建AI大模型应用的解决方案,支持云服务与私有化部署。本文介绍了在工作流和Agent中集成安全护栏的最佳实践,包括插件和扩展API两种方案。插件方式适用于工作流,一键安装实现输入输出防控;扩展API方式适用于Agent和工作流私有化部署场景,通过本地服务适配安全护栏API。文中还详细说明了操作步骤、前提条件及常见问题处理方法,帮助用户快速实现内容安全控制。
|
3月前
|
SQL 运维 关系型数据库
【产品升级】Dataphin V5.0版本发布:助力出海业务、增全量一体集成、异步调用API等更多功能等你发现
Dataphin是瓴羊推出的智能数据建设与治理平台,基于阿里巴巴内部实践,提供一站式数据建设与治理能力。V5.0版本研发新增支持Databricks作为离线计算引擎、支持MySQL数据库一键增全量同步、支持管理Hudi、Delta Lake表等;资产运营与消费持续提效,支持批量编辑目录名称及描述、Quick BI仪表板的上架管理等功能,增加资产可用性与盘点效率。
262 8
|
3月前
|
存储 人工智能 关系型数据库
媒体声音 | 专访阿里云数据库周文超:GenAI时代,数据管理底座强势升级
近日,阿里云数据库产品事业部总监、AnalyticDB PG及生态工具部负责人周文超,在DTCC 2025专访中分享了阿里云瑶池数据库在多模态数据处理、AI基础设施升级等方向的创新实践。
|
5月前
|
人工智能 搜索推荐 API
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
AI-Compass DeepSearch深度搜索生态:集成阿里ZeroSearch、字节DeerFlow、MindSearch等前沿平台,实现超越传统关键词匹配的智能信息检索革命
|
4月前
|
供应链 监控 搜索推荐
35页PPT|零售行业自助数据分析方法论:指标体系构建平台集成、会员与商品精细化运营实践
在零售行业环境剧变的背景下,传统“人找货”模式正被“货找人”取代。消费者需求日益个性化,购买路径多元化,企业亟需构建统一的指标体系,借助BI平台实现数据驱动的精细化运营。本文从指标体系构建、平台集成到会员与商品运营实践,系统梳理零售经营分析的方法论,助力企业实现敏捷决策与业务闭环。
35页PPT|零售行业自助数据分析方法论:指标体系构建平台集成、会员与商品精细化运营实践
|
5月前
|
机器学习/深度学习 人工智能 监控
CI/CD与模型监控平台集成MLOps系统实现的全面路径
MLOps是机器学习模型在生产环境中持续优化、部署和维护的关键。通过CI/CD流水线和模型监控平台的结合,可以大大提高模型开发和运维的效率,实现高效、稳定的模型服务。随着AI技术的快速发展,MLOps将在企业级AI应用中发挥越来越重要的作用。
CI/CD与模型监控平台集成MLOps系统实现的全面路径