数据中台建设引擎Dataphin亲测体验报告二:功能易用性&界面设计

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
简介: 上次说完了Dataphin产品的功能完备性,今天咱们就来聊下功能体验细节的易用性和界面设计。功能易用性 评分:4.5分点评:原创设计,越用越好用概要:主打的建模研发功能,使用体验独特,如果说前面提到的常规大数据开发功能是编码编辑器,那么建模研发功能就是智能计算器——5个工作日时间,2个ETL人员,完成Boss定的一个业务线的数据验证(原来是3个ETL同学长期维护,业务报表需求已经供不应求),ETL快速熟悉怎么使用之外,几位主要业务需求方也开始跃跃欲试。

上次说完了Dataphin产品的功能完备性,今天咱们就来聊下功能体验细节的易用性和界面设计。

功能易用性 评分:4.5分
点评:原创设计,越用越好用

概要:
主打的建模研发功能,使用体验独特,如果说前面提到的常规大数据开发功能是编码编辑器,那么建模研发功能就是智能计算器——5个工作日时间,2个ETL人员,完成Boss定的一个业务线的数据验证(原来是3个ETL同学长期维护,业务报表需求已经供不应求),ETL快速熟悉怎么使用之外,几位主要业务需求方也开始跃跃欲试。

主要功能操作步骤如下,供参考:
Step1:基础数据中心上云
这个业务线ODS层表大概80张,团队2个开发小哥大概用了2天半配置数据源、同步任务、Python任务,完成上云第一步~
这一步还是比较简单的,都是简单的界面操作。

Step2:公共数据中心上云
ODS层数据上云后半程,自己参与,和另外一位分析师同学大概花了1天时间,仿照示例,走通了一个小场景,熟悉了产品操作。并在工作日结束之前,顺利完成所有任务!
小场景大致如下:
规划:构建业务板块和数据域
这里都是一些表单操作,按照界面操作就行。
image

规范定义:维度、业务过程
这里也都是一些表单操作,按照界面指引就行,必填项填写正确就行。
image

维度要求配置主键计算逻辑——只要会写SQL中 “select from” 就行。
image

逻辑表:维度逻辑表/事实逻辑表
这里也是一些表单操作,操作步骤有点多,但是基本上可以按照界面引导操作,也不会出错。
大致如下:
image

整体体验还是挺好的:
比如添加事实模型的度量,这里选择表之后,直接勾选字段,右侧会自动读取元数据,生成添加的字段和计算逻辑。
image

比如比如可以可视化看到雪花模型结构,也能修改关联维度。修改提交成功后会提示下。
image
image

比较神奇的是,这样提交后,后台调度任务和代码就生成好了?!
image

开发环境的操作完毕,还要发布到生产环境。支持批量发布,这个操作比较简单。
image

发布校验提示,还是比较细心的,也可以防止发布到生产环境出错。
image

不过部分提示还是很奇怪的,这个,就看不懂了……
image

然后一键切换生产环境查看,非常平滑。一切都很顺利完成惹~~~
image

规范定义和逻辑表:派生指标和汇总逻辑表
定义派生指标确实就像产品文档介绍的,选择几个选项,就可以批量创建很多指标!大大提高数据生产效率。

不过,操作前,需要根据OneData的方法论,先分析和定义原子指标、业务限定,还需要将原子指标用到的来源逻辑表(问了技术支持,就是原子指标定义时,选择的来源逻辑表)上定义关联维度作为统计粒度,才能实现:
派生指标=原子指标+统计粒度+业务限定+统计周期
这样的效果。

操作步骤基本阿里云的网站都有,这里就大概分享下几个典型页面和操作注意事项,经验传承下。
原子指标,类似select的代码片段。定义原子指标尤其注意下,数据类型会用到派生指标里!谨慎定义!
image

业务限定,界面和原子指标差不多,更类似where条件的代码片段,不需要定义数据类型和统计周期标识。
派生指标,选择所需选项,组合定义即可。已生成组合的派生指标,不会重复生成~~
image

汇总逻辑表,与派生指标的统计粒度一一对应,派生指标根据统计粒度自动汇聚到汇总逻辑表上。
image

汇总逻辑表支持自定义指标,定义关联主键和时间分区,即可将自定义的指标挂载到汇总表使用。
image

值得一提的是,派生指标提交后,汇总逻辑表也会自动生成调度节点和代码。

即席查询汇总逻辑表,可获取主键所属关联维度的维度逻辑表的属性,也就是说,汇总逻辑表也类似雪花模型一样,每个地方都可以通过逻辑表的关联维度结构,遍历查询数据。这样防止维度逻辑表的数据,无意义冗余~好评设计!
image

关于“潜水”功能的二三事
分享了这么多操作步骤,大家可能和我有一样的感受,功能有点太多,产品引导还不够友好,所以会出现这样的问题:
1)不知道功能怎么用。比如公用计算逻辑,虽然界面有提示,但是缺少直接引导,还是因为其他产品问题咨询,才从技术支持那里得知这样一个神奇功能可以用。
2)功能的选择配置多,会有选择困难症。比如事实逻辑表,区分周期快照表和事务型表之外,这里还需要选择有主键、无主键?选择后,字段添加和校验方式也不太一样,如果没有特定场景,功能使用会有点懵。
3)有些功能太隐藏!比如支持雪花模型这样 “事实表.维度表.…….维度属性”这样查询字段数据,这个很方便啊,但是没有提示使用,偶尔情况发现使用。

其他期待
虽然功能有特色,总结下来,还是有些使用问题,大概如下:
1)概念太多,上面还没提到层级维度、衍生原子指标,还有各种套路,需要慢慢琢磨。这些概念一开始暴露出来,对我们这些从0开始用的小客户,有些不太友好,熟悉的过程虽然不长,但是一开始的使用体验会有折扣;
2)初始化操作事项较繁琐,为了最后1分钟创建派生指标,业务CDM层还有较漫长的路要走,这里伴随着各种概念和定义的纠结,对于普通的无数仓经验的ETL人员,还是有些挑战的;
3)一些细节功能还不支持:比如多事务的双主键事实表,逻辑表也不支持小时调度(技术问题?),小时逻辑表也不支持;
4)运维配套功能缺少:逻辑表不好运维,缺乏全局的依赖关系及批量管理机制,全量调整来不及。

总的来说,这4.5分给得有点低,分低的主要原因——对于没有采购专家服务的我们小公司来说,入门还是有点难度,踩了一些坑,有些输在起跑线的感觉,应验了一句“万事开头难”。
不过真的是越用越好。作为开发者,感觉Dataphin和传统的ETL软件大不相同,有设计感之外,从写代码角度,真的提升效率~后续找数据、查数据、数据体系运维都方便,毕竟命名和对象关系都清晰了~

产品界面设计 评分:4.8分
点评:科技感与设计感
概要:
之前听UED提到站酷上有人分享ToB产品设计,思路独特,设计有创意,参详对比下实际产品,产品设计还原上还是达到设计师目标——

  • 明亮多样的色彩搭配
  • 3D的icon设计
  • 契合主题的动画
  • 点睛的界面切换转场
  • 活力界面

这些都让原本枯燥的开发工具多了一些生气与活力,用这样的工具进行数据研发,心情也好些。
image

交互较友好
值得一提的是,产品的操作交互体验也不错,主要流程的必要引导、校验和提示都恰到好处。
image

总结:独树一帜,值得尝试
整体来说,好的点:

  • 作为To B产品,比较成熟了,项目角色管理、编辑器、生产开发隔离、多云多计算引擎这些功能也都可以支持,整体链路很顺畅。
  • Dataphin自动化研发是真的牛,这么多One系列复杂概念,最终能实现开发、发布、运维、资产一套,也是厉害的,至少说明OneData概念成功落地成体系化的产品了!
  • 研发经验和知识沉淀产品中,各种数据体系可以快速迭代,再也不用查各种文档,维护数据也方便了。
  • 业务视角管理,数据易查易回溯,比如出现问题,可以根据界面快速回溯源头、追溯问题链路(派生指标→原子指标/业务限定/统计粒度→事实/维度逻辑表),数据污染之类问题,很好查以及修复。

目前不好用的点,主要在初始化使用难,但是使用上手一段时间,也就习惯了。
(这里想提个需求,这些智能化过程也太黑盒了,有时候数据不太好验证,是否有什么方法可以对比界面配置代码和任务链路 vs 智能化生成代码和任务链路?另外有时候有代码优化,也不知道优化路径是什么情况,希望可以让咱们开发同学也参与下,有个智能引擎的运维界面,就好了,歪歪一下~~)

听说最近有新版本要上线,很期待,希望能和上面问题一起升级解决,给咱们开发者带来更多不一样惊喜,这样才能让咱们这些生产力给企业管理者带来更多价值啊!

结语:
阿里巴巴数据中台团队,致力于输出阿里云数据智能的最佳实践,助力每个企业建设自己的数据中台,进而共同实现新时代下的智能商业!
阿里巴巴数据中台解决方案,核心产品:
Dataphin,以阿里巴巴大数据核心方法论OneData为内核驱动,提供一站式数据构建与管理能力;
Quick BI,集阿里巴巴数据分析经验沉淀,提供一站式数据分析与展现能力;
Quick Audience,集阿里巴巴消费者洞察及营销经验,提供一站式人群圈选、洞察及营销投放能力,连接阿里巴巴商业,实现用户增长。
欢迎志同道合者一起成长!

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
相关文章
|
3月前
|
机器学习/深度学习 敏捷开发 存储
数据飞轮:激活数据中台的数据驱动引擎
数据飞轮:激活数据中台的数据驱动引擎
|
2月前
|
运维 数据处理 调度
Dataphin功能Tips系列(30)-限流配置
某大型电商平台在每天的凌晨时段需要进行大量的数据处理任务,比如订单处理、库存同步、用户行为分析等。此外,平台还需要定期进行历史数据的补数据工作,以确保数据完整性和一致性。在进行补数据时,如果需要补的历史时间周期比较长,这些批处理任务会消耗大量的计算资源,导致批处理任务(如订单处理、库存同步)响应变慢甚至超时失败,这是我们应该怎么保障每天的批处理任务(订单处理、库存同步)的按时产出?
|
2月前
Dataphin功能Tips系列(27)-排他编辑锁
在实际开发中,为了避免多人同时编辑同一份代码而导致的问题,通常会采用锁机制来保护代码。然而,普通的锁机制有时并不能完全阻止其他开发人员在编辑时抢占锁,这使得用户可互相覆盖锁定状态,在dataphin中如何解决这一问题?
Dataphin功能Tips系列(27)-排他编辑锁
|
2月前
|
JSON 计算机视觉 数据格式
LangChain-17 FunctionCalling 利用大模型对函数进行回调 扩展大模型的额外的能力 比如实现加减乘除等功能
LangChain-17 FunctionCalling 利用大模型对函数进行回调 扩展大模型的额外的能力 比如实现加减乘除等功能
54 4
|
3月前
|
消息中间件 Kafka 搜索推荐
|
2月前
|
人工智能 API
LangChain-14 Moderation OpenAI提供的功能:检测内容中是否有违反条例的内容
LangChain-14 Moderation OpenAI提供的功能:检测内容中是否有违反条例的内容
44 2
|
3月前
|
调度 存储 数据库
|
2月前
|
数据处理 调度
Dataphin功能Tips系列(31)-自定义资源组
某零售企业最近在做促销活动,希望保证某些数据处理任务(订单处理、库存更新)任务能够快速按时完成,如何保证这些高优任务的调度资源不被其他任务占用,能按时执行?
|
2月前
Dataphin功能Tips系列(29)-计算任务版本对比/版本回滚
开发人员小张先前编写的一个脚本,在进行了修订之后,发现逻辑出现了偏差,但他已经不记得前一版本的具体内容了。在这种情况下,应该怎样通过版本对比来看出两版脚本之间的差别,并且回滚到之前的版本呢?