领域建模-指标梳理工具-阶段性体验/调研认知输出

简介: 本文基于笔者的经历,简要介绍了其基于大数据在供应链行业应用思维转变的3个阶段:零碎供应链场景数据分析-数据资产治理-面向对象数据建模

【引言】:
在笔者作为供应链业务的角色时,经常需要针对特定场景,进行分析并解决业务问题。
在A公司的物流部,公司当时没有大数据平台,只有数据分析认知能力的笔者,遇到了跨数据库抓数卡壳的尴尬。举例说明,商城订单在MYSQL的OMS里,运单在ORACLE的LMS里。当商城的老板派遣其数据分析伙伴来找物流部对运单账单明细的时候,大家就尬住了。跨数据库关联取数毕竟还是没有同一个数据库跨表关联便捷。
在B公司的供应链运营中心,集团老板尤其看重数据安全,权限收口,集团有专门的BI团队提供取数服务,且提需求需要业务明确口径与数据来源。那么一个先有鸡还是先有蛋的问题就来了,业务哪里会熟悉数据库以及表结构呢?经常发生等了一周数据出来以后发现并不能满足业务需求;当口径和来源逐渐依靠试错沉淀下来,高频取数需求转化为报表开发需求时,不同部门/BU一开会,精彩又来临了。因为不同部门同一指标的口径以及来源难以统一,加之每一个报表的沉淀背后都有一个曲折或忐忑的故事,所以大家基本都只信自己的报表。万般无奈之余,当需要统一时,只能统一以财务口径为准。
不论是数据分析还是提报表需求,顺畅的数据清洗加工体验那基本是不存在的。区别只是在于梗在哪里以及梗多少次而已。

【一个概念两个工具】:
机缘巧合+主动争取,目前笔者有幸从事大数据在供应链行业的应用。解决问题的角度也从数据分析延伸为数据治理以及大数据开发。相信但凡是将数据作为资产来对待的公司,都会需要了解领域建模的概念。手动画图(领域划分/脑图/ER图)之余,有幸接触到指标梳理工具,可以将其沉淀为企业数据资产。这两个产品分别是JD EASY 系列的EasyModel以及阿里的Dataphin。

先来看一下JD的EASY MODEL。
因为京东的产品分为研发产品以及业务产品,所以其产品设计的方法论也根据职能进行了划分。其主要思路是在领域以及主题划分完成之后,BI伙伴将维表以及明细表开发好,供业务根据自身多元的需求灵活加工产生派生指标以及汇总表。
可能是由于先入为主的原因,又可能是EASY MODEL产品运营团队耐心的培训,以及产品覆盖的功能从核心功能逐期开发,EASY MODEL的概念还是比较适合零售场景以及容易吸收的。
image.png

产品界面简要图示如下:
首页案例.png

再来看一下阿里的Dataphin.
说到数据治理,那自然绕不开阿里云以及阿里的数据中台产品Dataphin。
通过阅读产品文档中【使用教程】中【面向零售店铺的模型建构与管理】...恩,不知道是巧合还是同行们心有灵犀,EASY MODEL同该章程的建模部分基本一模一样...
不同的是从操作上来说,EASY MODEL有托拉拽;
从功能上来说,dataphin还有完善的调度管理以及质量管理功能。

那看点不同的,通过阅读产品文档,了解到其数据【萃取】功能模块主要如下图,其中【行为中心】是从对象的角度(案例中为人)的视角来命名各个规范,除此之外,还延伸了【标签中心】的功能。
WechatIMG15.jpeg

那从建模到萃取看起来流程以及概念都不一样,是不是建模的方法论就不一样了呢?同时去了解两个功能会不会占用很多认知成本?
条条大路通罗马,笔者认为,治理的理念和流程是类似的,只是名称不同而已,下图列出笔者目前理解的俩个功能不同名称/概念的映射。若有偏差,欢迎打脸。

image.png

从产品的产出,也就是行为看板所展示的内容来看,dataphin不仅仅是生成了汇总表,并且连可视化展功能一并包涵了。萃取-建模-展现一条龙。

dataphin-行为.png

时间有限,对两个产品的认知还不够深入,本次主要聚焦于其数据治理的核心方法论进行了初步的认知。也激发了笔者关于如何依托此类工具进行对象维度的领域建模的思考。
最后,希望多一些类似这两款提高数据治理以及大数据开发效率的产品,因为这意味着可以减少许多不必要的BI开发产品文档。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
负载均衡 安全 应用服务中间件
什么是正向代理和反向代理
正向代理是客户端与服务端之间的中介,用于访问受限资源,如V/P/N和动态IP代理,同时可隐藏客户端IP。反向代理则接收客户端请求并转发给后端服务器集群,隐藏真实服务器信息,常用于堡垒机和负载均衡,如nginx。正向代理焦点在客户端,反向代理关注服务端。
|
Ubuntu 安全 Linux
百度搜索:蓝易云【Ubuntu 20.04 安装VNC Server的教程。】
请注意,VNC连接是以明文形式传输数据的,因此建议在安全的网络环境中使用VNC,并设置强密码以确保安全性。
481 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
2025 年值得选择的 TVC 视频制作服务推荐
2025年AI TVC视频制作服务商榜单出炉!集之互动、即梦、可灵三大平台各具优势,覆盖创意脚本、智能生成、私有化部署与全场景适配。AI技术深度定制,安全合规,助力品牌高效传播,实现商业价值跃升。
279 1
|
2月前
|
存储 消息中间件 小程序
掌上医院预约挂号系统如何与医院HIS系统对接?
掌上医院预约挂号系统通过移动互联网,实现挂号、就诊、查报告全流程线上化。依托与HIS等系统对接,打通医生排班、号源管理、数据同步等环节,支持微信小程序等多端访问,有效缓解排队难、信息不畅等问题,提升医疗效率与患者体验。
246 1
|
6月前
|
存储 机器学习/深度学习 缓存
阿里云企业级九代云服务器:c9i、g9i、r9i实例的收费标准、性能与选型攻略
计算型c9i、通用型g9i和内存型r9i实例是阿里云专为需要高性能云服务器的用户推出的第九代新品云服务器实例规格,适用于机器学习推理应用,数据分析等场景。本文为大家介绍阿里云服务器的新品实例——计算型c9i、通用型g9i、内存型r9i实例各自的性能参数与适用场景,再到最新的活动价格与其他实例的对比选型指南,以供参考。
|
自然语言处理 IDE 测试技术
通义灵码——有了它让我的编程效率和质量直线上升!
作为一名大数据开发工程师,我每天与代码和数据打交道,享受解决复杂问题的乐趣。最近,我遇到了一位超级“码”力助手——通义灵码。它不仅是一个简单的代码补全工具,更像是一个拥有高度智慧的编程伙伴,能够理解我的编程意图,给出最合适的建议,大大提升了我的工作效率和编程体验。本文将分享如何在VsCode中安装和使用通义灵码,以及它在我的实际编程工作中发挥的重要作用。
|
12月前
|
芯片 内存技术
STM32 Customer BootLoader 刷新项目 (二) 方案介绍
本项目设计了一款基于STM32的二级BootLoader,旨在为客户自定义启动过程提供软件更新和操作后门。BootLoader架构分为三层:ST自带Boot(SB)、客户定制化Boot(CB)和应用层(APP)。CB通过USART与MCU通信,支持多种指令如版本查询、擦除扇区、写入数据等,实现灵活的软件管理和更新功能。Flash空间分配为Sector 0-1用于CB,Sector 2-11用于APP。整个方案详细介绍了内存布局、跳转逻辑及支持的指令集,确保系统稳定运行并支持未来的扩展需求。
 STM32 Customer BootLoader 刷新项目 (二) 方案介绍
|
开发工具
基本 Vim 命令 - 入门指南
【8月更文挑战第18天】
395 0
|
弹性计算 固态存储 ice
阿里云ECS服务器2核16G、4核32G和8核64G不同配置租赁价格表
2024年阿里云服务器提供多种配置与实例规格,如2核16G、4核32G及8核64G等,用户可根据需求选择内存型r8i、通用算力型u1等不同架构。以2核16G为例,r8i每月334.19元起,u1则为286.2元起。公网带宽与系统盘亦有多档价位。实际价格与折扣请参照官网。
706 5