数据中台:前台调用能快速响应、数据口径一致(1)

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
简介: 数据中台:前台调用能快速响应、数据口径一致(1)

标签类目体系方法有什么用处?


标签类目体系方法有什么用处?对企业来说究竟有什么好处?企业数据部门人员经常会对标签类目体系存在的意义产生疑问。如果不建设标签类目体系,用传统的数仓建模是否也可以?数据部门负责人在汇报企业数据资产建设方案时,也面临着如何向CEO说清楚构建标签类目体系的原因和标签化的数据资产价值等难题。


3.1 数据资产可复用


标签类目体系是中台概念的核心落地点。中台概念最近非常火,它源自阿里巴巴过去几年在数据技术、中间件技术等领域的积累。


1.前台、中台、后台三者之间的关系


后台就像海面以下部分的海岛,有些可以连接,有些天然就无法连接。企业的业务库、信息库、资源库等就是企业的后台,数据库、计算引擎、信息技术、硬件设备等有些可以兼容,有些无法兼容。很多企业,特别是大型集团企业在采购底层支撑系统和服务时,会刻意选择不同厂家的产品,防止构成对某一家企业产品的强依赖而陷自身于不利位置。


前台由业务、应用等组成。随着近几年互联网技术的发展,数字化转型的深入,消费者诉求的转变以及市场竞争的日趋激烈,前台业务形态逐渐向场景化、灵活化、精细化转变。传统的流程型组织系统(ERP、OA、CRM等)已经无法适应变化多端的前台业务需求,企业迫切需要一种新型的组织系统来承载前台业务随着场景不同而快速形成的资源间的柔性组合。哪家企业的前台业务能真正做到随市场和客户而动,响应迅速,哪家企业就能真正占领市场,赢得消费者,具有更强的生命力。前台和后台之间的某些属性是相矛盾的。1)前台要灵动,后台要稳定。2)前台要连接打通,后台资源有时天然不打通。3)前台越拆越小,要的是速度,因此叫小前台;后台越建越大,要的是全面,因此叫大后台。前台和后台之间需要一个中台来承接、消弭它们之间的差异,如图3-1所示。


2.数据中台的两大要义


数据中台最核心的要义有两点,如图3-2所示。


image.png


image.png


1)在底层数据打通后,把经常用到的数据资源提炼、沉淀下来放在中台。
中台最核心的目的就是完成前台业务对后台资源的快速调用、快速试错。那些经常会被调用、可复用的资源能力可以从后台中提炼出来,存放到中台中,并通过良好的接口预留,实现与前台的无缝对接。就像我们浏览网页时,很多常用的信息、图片都会提前加载在前端服务器上,并不需要每次都去后端数据库读取,从而提升用户体验和业务效率。


既然数据中台的第一要义是把常用的数据资源沉淀下来供前台业务快速调用,那么标签作为可复用的数据资源的最佳载体,自然就是数据中台理念的落地核心了。标签越来越多,就需要标签类目体系来进行组织,其目的在于更好地梳理、使用标签。标签和标签类目体系始终围绕数据的价值、价值运营、高效运作等原则来管理和规划数据资产。


2)前台业务调用数据资源时中台能快速响应、无缝连接。如果没有中台,前台调用一个数据资源需要直接到后台数据库中查找,查找流程复杂且性能低下,往往需要几天时间。此外,前台业务并不能直接将后台系统改造成适合自己使用数据的方式,否则可能会对其他前台业务产生较大影响。


当中台使用标签对可复用的数据资源进行沉淀并提供快速运用时,就能保障数据中台第二个要点的平稳落地:前台业务通过选取标签、配置所需的数据服务,将数据资产转化为对前台业务赋能的数据应用。


3.标签的适用范围


如果企业仅需在小系统范围内使用数据,例如构建一个简单的报表看板,不考虑复用性和后期维护优化,那么可以不采用标签和标签化处理方式,此时考虑的是如何快速支撑当前局部业务的需求。标签和标签类目体系主要关注的是哪些数据可复用,因此它们一定不是用来解决单一场景问题的。


当一家企业要正式构建数据资产时,就需要使用标签类目体系方法对数据资源进行完整梳理和规划。当企业发展到众多业务都需要数据服务支撑,特别是到了交叉数据源的开放共享阶段,就必须在标签方法论的基础上构建上层业务对数据资产的应用机制。


4.数据资产化的必经之路随着企业对数据价值认知的不断深入,数据自然需要资产化,即对数据资源进行标签封装:从命名、规范、质量、安全等维度对每一项数据资源进行标注、说明、定义。数据不能再像以前面向单一场景时那样怎么快怎么用:数据没有备注,或只有数据操作者自己看得懂,甚至只要系统能跑通,业务上能使用起来,数据端没有注解都没关系。


数据资产化的最终目的就是让业务人员也能阅读、理解、方便地使用数据,因此将数据资产转化为可阅读、易理解的载体就是把数据资源标签化。很多企业虽然没有提出“标签化”的概念,但也在努力让资产往业务方向靠,其实也是在做标签化的趋同动作。


在这种思路下积累起来的标签集合可以通过标签门户向业务人员开放,供其查看、了解数据资产分布,并配合标签服务工具来方便业务端操作,从而激发业务活力,完成对多变场景的超速响应。业务人员查看数据资产就像逛淘宝一样简单,可以随时随地通过搜索或者类目分类查看企业可提供的标签。这些标签的解释术语(元标签)都是按照业务可理解的方式来组织和描述的,因为只有业务人员能看懂,他们才有兴趣进一步查看详情。在详情中还会具体罗列这些标签的历史使用情况:已经被哪些部门在哪些业务场景中使用,是怎么用的,用的效果怎么样。遇到合适的标签,业务人员可以将其加入购物车或者收藏夹,保存为自己的标签集。确定这些标签要为业务使用时,通过标签服务工具,让业务人员自己通过交互界面以无代码的方式创建数据服务或数据应用。


例如某业务人员查看了“性别”和“年龄”标签后觉得不错,可以先将其加入收藏夹。一周后业务场景提出数据服务需求:针对不同性别、年龄的消费者显示不同的活动内容。此时该业务人员可以申请收藏夹中“手机号”“性别”“年龄”等标签的使用权限,获得授权后导出到标签服务工具中。在标签服务工具中选择【数据查询】这种服务类型,将“手机号”标签设为输入项,将“性别”“年龄”标签设为输出项,即可快速配置出一个通过消费者手机号查询其性别、年龄的数据服务接口,供业务系统调用。

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
2月前
|
机器学习/深度学习 敏捷开发 存储
数据飞轮:激活数据中台的数据驱动引擎
数据飞轮:激活数据中台的数据驱动引擎
|
3月前
|
SQL 运维 Oracle
【迁移秘籍揭晓】ADB如何助你一臂之力,轻松玩转Oracle至ADB的数据大转移?
【8月更文挑战第27天】ADB(Autonomous Database)是由甲骨文公司推出的自动化的数据库服务,它极大简化了数据库的运维工作。在从传统Oracle数据库升级至ADB的过程中,数据迁移至关重要。
68 0
|
2月前
|
机器学习/深度学习 数据可视化 数据挖掘
唤醒数据中台潜力:加速数据飞轮转动,实现数据驱动的秘籍
本文探讨了如何通过数据飞轮激活数据中台的潜力,实现数据驱动的创新。文章分析了数据中台面临的挑战,如数据孤岛和工具复杂性,并提出了建立统一数据治理架构、引入自动化数据管道和强化数据与业务融合等策略。通过实际案例和技术示例,展示了如何利用数据飞轮实现业务增长,强调了数据可视化和文化建设的重要性。旨在帮助企业充分挖掘数据价值,提升决策效率。
64 1
唤醒数据中台潜力:加速数据飞轮转动,实现数据驱动的秘籍
|
2月前
|
存储 机器学习/深度学习 数据管理
数据技术的进化史:从数据仓库到数据中台再到数据飞轮
数据技术的进化史:从数据仓库到数据中台再到数据飞轮
|
2月前
|
机器学习/深度学习 消息中间件 搜索推荐
【数据飞轮】驱动业务增长的高效引擎 —从数据仓库到数据中台的技术进化与实战
在数据驱动时代,企业逐渐从数据仓库过渡到数据中台,并进一步发展为数据飞轮。本文详细介绍了这一演进路径,涵盖数据仓库的基础存储与查询、数据中台的集成与实时决策,以及数据飞轮的自动化增长机制。通过代码示例展示如何在实际业务中运用数据技术,实现数据的最大价值,推动业务持续优化与增长。
82 4
|
2月前
|
机器学习/深度学习 搜索推荐 算法
从数据中台到数据飞轮:企业升级的必然之路
在探讨是否需从数据中台升级至数据飞轮前,我们应先理解两者之间的关系。数据中台作为数据集成、清洗及治理的强大平台,是数据飞轮的基础;而要实现数据飞轮,则需进一步增强数据自动化处理与智能化利用能力。借助机器学习与人工智能技术,“转动”数据并创建反馈机制,使数据在循环中不断优化,如改进产品推荐系统,进而形成数据飞轮。此外,为了适应市场变化,企业还需提高数据基础设施的敏捷性和灵活性,这可通过采用微服务架构和云计算技术来达成,从而确保数据系统的快速扩展与调整,支持数据飞轮高效运转。综上所述,数据中台虽为基础,但全面升级至数据飞轮则需在数据自动化处理、反馈机制及系统敏捷性方面进行全面提升。
103 14
|
1月前
|
机器学习/深度学习 JSON JavaScript
LangChain-21 Text Splitters 内容切分器 支持多种格式 HTML JSON md Code(JS/Py/TS/etc) 进行切分并输出 方便将数据进行结构化后检索
LangChain-21 Text Splitters 内容切分器 支持多种格式 HTML JSON md Code(JS/Py/TS/etc) 进行切分并输出 方便将数据进行结构化后检索
29 0
|
1月前
|
数据管理 数据挖掘 大数据
数据飞轮崛起:数据中台真的过时了吗?
数据飞轮崛起:数据中台真的过时了吗?
|
1月前
|
存储 数据管理 大数据
从数据仓库到数据中台再到数据飞轮:社交媒体的数据技术进化史
从数据仓库到数据中台再到数据飞轮:社交媒体的数据技术进化史
|
3月前
|
关系型数据库 Serverless API
神秘的 ADB Serverless 模式,究竟是怎样实现数据共享的?答案等你来揭晓!
【8月更文挑战第27天】在数字化时代,数据共享至关重要。阿里云AnalyticDB for MySQL的Serverless模式提供了一种高效便捷的解决方案。它采用多租户架构,确保数据安全隔离的同时支持资源共享;具备自动弹性伸缩能力,优化资源利用;支持多样化的数据导入导出方式及丰富的API,便于集成到各类应用中,实现数据价值最大化。无论是初创企业还是大型组织,均可从中获益。
57 0