数据中台:前台调用能快速响应、数据口径一致(4)

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
简介: 数据中台:前台调用能快速响应、数据口径一致(4)

3.标签是数据商品最适合的颗粒度


数据商品中的数据本身根据不同的颗粒度可以分为对象层、表层、字段层、字段取值层。例如,用户是一种对象,用户下会有用户基本信息表、用户交易明细表、用户注册认证表等表级信息组织。每张表里都会有围绕这种表的详细字段,例如基本信息表中会有性别、年龄、职业等基本信息,用户交易明细表中会有交易时间、交易金额、交易商品等交易信息,用户注册认证表中会有注册日期、注册会员号、注册手机号、认证日期、认证绑定身份证号等注册认证信息。在职业这个字段取值中,会存在教师、医生、工人等多种取值类型。表3-1为不同的数据粒度示例


表3-1 不同的数据粒度示例


image.png


从中可以发现,同一对象群体的不同个体在“对象”“表”“字段”层面都具有相同的信息项,在字段取值层面存在差异性。字段粒度是刻画某一对象群体通用特征的最小粒度。例如每个用户都会有其“基本信息表”“职业”等信息,但是在“职业”的字段取上每个用户都不太一样。


可规模化商业运作的商品应具备一定的通用性和多样性,以达成有效平衡:过于个性化的商品不利于规模化组织、售卖、管理,过于笼统的商品分类又不利于商品的有效选用。


在标签类目体系方法论中,对象对应于根目录,多种表对应于多级类目,属性/字段对应于标签,属性/字段值对应于标签值,如表3-2所示。标签类目体系中的标签是属性粒度的业务向资产形式,最适合作为数据商品中数据本身信息的业务逻辑封装形态。


表3-2 标签类目体系方法论中各概念与数据粒度的对应关系


image.png


4.数据商品化全流程运营


以标签为核心的数据商品化全流程运营过程如下。1)根据业务场景需求,按照标签类目体系方法论设计标签集。例如某女装频道的业务部门打算开展千人千面的精准营销,需要对用户进行肖像刻画,数据产品经理会与业务人员沟通,然后设计业务部门所需的标签,例如“性别”“年龄”“预测购买力”“预测风格偏好”“最近购买品类”等。


2)标签创建后生成标签开发任务,分配给数据开发工程师或算法工程师。当具体字段开发完成后,将数据字段与标签进行关联映射。至此,标签的设计就完成了,经过审核后可以在标签集市中上架,作为数据商品信息呈现。


3)业务人员可以搜索、浏览、查看标签化的数据商品信息,包括标签名称和标签详情、功效、可应用场景、用户评价等。如果发现自己需要或感兴趣的标签,业务人员可以将其加入购物车或收藏夹,以供下一阶段配置数据服务使用。


4)通过服务化的工具,可以将选中的标签集合快速配置成数据服务或数据应用(真正的数据商品形态),供业务部门使用。


5)业务使用过程中所沉淀的日志、反馈、事故等信息都可以用来更好地管理标签和服务,帮助优化数据商品的质量。


6)标签管理过程可以更好地优化现有标签设计。例如,对于质量不高且无人使用的标签,可以吸取教训,避免以后再设计类似的标签;对于质量不高但需求高的标签,寻找更好的设计思路来提升标签质量;对于质量高但需求不高的标签,分析原因后修正标签设计思路;对于质量高且需求高的标签,可以不断优化或设计出更多类似特征的标签。


通过标签化的数据商品参与价值分配,可以预见以下几个结果,如图3-4所示。


image.png


  • 数据部门将会从成本中心变为利润中心。数据部门生产的数据商品会在业务中发挥价值,并通过商品化进行价值衡量与结算,而不产生价值的数据都会被下架以减少成本支出,最终数据部门会收支平衡,乃至变成一个以数据作为核心生产要素的产能工厂,实现数据变现。


  • 数据部门中的标签运营部门会成为重中之重。标签运营部门的人员包括数据产品经理或标签设计师、标签管理员、标签运营专员等。标签运营部门会以业务为导向,以实现数据价值为目标,全链路开展标签价值的测算、计量和扩大化的工作。


  • 通过价值才能真正解决数据打通、治理、使用等“老大难”问题。对奋斗在第一线的数据人员来说,数据打通、治理、使用是压在心上的三座大山。数据打通是数据资产化的前提,但因为存在部门墙、信息孤岛等问题,大家对原始数据过度保护了。数据治理环节复杂、推动困难,导致业务人员没有耐心,数据人员没有信心。数据使用问题是针对业务人员而言的,有时候数据部门非常希望业务部门的人员能对数据感兴趣,能使用起来,但往往因为沟通不畅及数据门槛较高,双方在认知层面存在较大鸿沟。通过标签可以很好地将数据价值发挥出来,用价值倒推业务人员主动理解数据。DT时代,谁掌握了数据谁就有制胜权,没有使用上数据的公司、业务只能被动受限。在数据价值展现后,业务部门会主动与数据部门沟通数据源打通、数据质量提升优化、数据场景化使用等问题。这些问题在价值面前都能迎刃而解,千万不要仅仅依靠技术手段或行政命令来解决。


  • 数据价值运营是一个持续运作、坚持不懈的过程。数据价值运营是一个艰苦、持续的运行态,环节中的任何一环“罢工”,都会使得整个环节运行卡顿或减慢速度。例如数据源头有3个月不更新,产出的数据质量就会变差,业务部门就会投诉或拒绝使用。一旦业务部门在整个闭环中的参与度降低,三座大山又会从头再来。所以数据问题不是解决一次就能“长治久安”的,数据事业是一条需要长期耕耘、时刻警惕的艰辛之路。


对于以数据价值实现作为自身理想坚守的数据人来说,当数据魅力真正迸发的时候,那种兴奋和感动会让我们觉得人生的价值也一起得到了实现,也许就像有人说的,人生和理想互指迭代、同频共振了。所以真正的数据人并不会在数据问题面前失落和放弃。

相关实践学习
阿里云百炼xAnalyticDB PostgreSQL构建AIGC应用
通过该实验体验在阿里云百炼中构建企业专属知识库构建及应用全流程。同时体验使用ADB-PG向量检索引擎提供专属安全存储,保障企业数据隐私安全。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
2月前
|
机器学习/深度学习 敏捷开发 存储
数据飞轮:激活数据中台的数据驱动引擎
数据飞轮:激活数据中台的数据驱动引擎
|
3月前
|
SQL 运维 Oracle
【迁移秘籍揭晓】ADB如何助你一臂之力,轻松玩转Oracle至ADB的数据大转移?
【8月更文挑战第27天】ADB(Autonomous Database)是由甲骨文公司推出的自动化的数据库服务,它极大简化了数据库的运维工作。在从传统Oracle数据库升级至ADB的过程中,数据迁移至关重要。
66 0
|
2月前
|
机器学习/深度学习 数据可视化 数据挖掘
唤醒数据中台潜力:加速数据飞轮转动,实现数据驱动的秘籍
本文探讨了如何通过数据飞轮激活数据中台的潜力,实现数据驱动的创新。文章分析了数据中台面临的挑战,如数据孤岛和工具复杂性,并提出了建立统一数据治理架构、引入自动化数据管道和强化数据与业务融合等策略。通过实际案例和技术示例,展示了如何利用数据飞轮实现业务增长,强调了数据可视化和文化建设的重要性。旨在帮助企业充分挖掘数据价值,提升决策效率。
63 1
唤醒数据中台潜力:加速数据飞轮转动,实现数据驱动的秘籍
|
2月前
|
存储 机器学习/深度学习 数据管理
数据技术的进化史:从数据仓库到数据中台再到数据飞轮
数据技术的进化史:从数据仓库到数据中台再到数据飞轮
|
2月前
|
机器学习/深度学习 消息中间件 搜索推荐
【数据飞轮】驱动业务增长的高效引擎 —从数据仓库到数据中台的技术进化与实战
在数据驱动时代,企业逐渐从数据仓库过渡到数据中台,并进一步发展为数据飞轮。本文详细介绍了这一演进路径,涵盖数据仓库的基础存储与查询、数据中台的集成与实时决策,以及数据飞轮的自动化增长机制。通过代码示例展示如何在实际业务中运用数据技术,实现数据的最大价值,推动业务持续优化与增长。
79 4
|
2月前
|
机器学习/深度学习 搜索推荐 算法
从数据中台到数据飞轮:企业升级的必然之路
在探讨是否需从数据中台升级至数据飞轮前,我们应先理解两者之间的关系。数据中台作为数据集成、清洗及治理的强大平台,是数据飞轮的基础;而要实现数据飞轮,则需进一步增强数据自动化处理与智能化利用能力。借助机器学习与人工智能技术,“转动”数据并创建反馈机制,使数据在循环中不断优化,如改进产品推荐系统,进而形成数据飞轮。此外,为了适应市场变化,企业还需提高数据基础设施的敏捷性和灵活性,这可通过采用微服务架构和云计算技术来达成,从而确保数据系统的快速扩展与调整,支持数据飞轮高效运转。综上所述,数据中台虽为基础,但全面升级至数据飞轮则需在数据自动化处理、反馈机制及系统敏捷性方面进行全面提升。
103 14
|
1月前
|
机器学习/深度学习 JSON JavaScript
LangChain-21 Text Splitters 内容切分器 支持多种格式 HTML JSON md Code(JS/Py/TS/etc) 进行切分并输出 方便将数据进行结构化后检索
LangChain-21 Text Splitters 内容切分器 支持多种格式 HTML JSON md Code(JS/Py/TS/etc) 进行切分并输出 方便将数据进行结构化后检索
26 0
|
1月前
|
数据管理 数据挖掘 大数据
数据飞轮崛起:数据中台真的过时了吗?
数据飞轮崛起:数据中台真的过时了吗?
|
1月前
|
存储 数据管理 大数据
从数据仓库到数据中台再到数据飞轮:社交媒体的数据技术进化史
从数据仓库到数据中台再到数据飞轮:社交媒体的数据技术进化史
|
3月前
|
关系型数据库 Serverless API
神秘的 ADB Serverless 模式,究竟是怎样实现数据共享的?答案等你来揭晓!
【8月更文挑战第27天】在数字化时代,数据共享至关重要。阿里云AnalyticDB for MySQL的Serverless模式提供了一种高效便捷的解决方案。它采用多租户架构,确保数据安全隔离的同时支持资源共享;具备自动弹性伸缩能力,优化资源利用;支持多样化的数据导入导出方式及丰富的API,便于集成到各类应用中,实现数据价值最大化。无论是初创企业还是大型组织,均可从中获益。
57 0