1,数仓规划与建模研发:建模研发支持通过可视化定义SQL表达式的方式完成模型设计,而系统自动发布生成任务与生产数据,且所有数据指标标准规范无二义性,适用于业务对数据需求多且及时性要求高而专业人才有限情况的客户,一般需要全局化数据监控; 2,数据萃取:支持通过自定义配置参数的方式三步完成以实体对象为中心的业务主数据提炼、DMP构建,实现ID识别连接、标签标准规范地自动化生产,消除数据孤岛,适用于可以有丰富数据自建DMP、有营销投放等对象识别分析需求、用数据驱动业务发展而专业人才有限情况的客户,一般需要数据化运营; 3,资产分析及治理:支持资产化视角构建及管理数据体系并一目了然数据价值,适用于数据类型多样、数据丰富、数据成本或者质量安全对企业很重要等需要统一管理数据的客户,特别是以数据为业务的、数据融入业务的; 4,数据服务:支持面向主题的逻辑表查询,保证数据被快捷方便地查找定位、数据查询SQL得到最大的简化,提高效率的同时,保证规范、标准、无二义的数据输出至业务应用,适用于有很多数据应用、需要API化或者其他非代码查询方式使用数据的客户,数据化运营或者数据业务化都会有需求。
智能构建云上数仓,提高战略决策效率 场景:某集团在全国经营多家连锁超市,线上线下零售渠道及形态众多。 痛点:因为业务系统多、数据来源多,经营所需的数据需求高频且多样化。但数据体系复杂、数据不统一,数据分析速度和数据准确一致性难保障,战略决策与数据化运营受阻。 解决方案: • 数据融合:通过数据引入功能,将业务系统数据集成、融合一体,统一基础数据。 • 数据建模:通过规范建模功能,结合业务发展需求,自顶向下设计标准的数据模型,统一公共数据。 • 数据生产:基于建模后系统代码自动化托管生产功能,快速响应业务需求。模型设计输出后,自动化生成代码、周期性调度产出任务。 价值: • 数据建设统一:数据标准规范定义。 • 数据研发提效:自动化代码生成。 • 战略决策高效:数据分析准确,数据需求响应及时。 推荐搭配组合:Dataphin + MaxCompute MaxCompute详情请参见什么是MaxCompute。 输出主题式数据服务,提高数据化运营效率 场景:某公司是一家大型跨省直营餐饮品牌公司,具有线上线下多个客户触达渠道,以爆款思维策划公司品牌。 痛点:因业务扩张快,用户数据丰富,拉新留存效率、营销及转化效果急需提高。但各个获客渠道的用户数据分散,会员管理体系单一,推荐准确度不高,会员营销方式有限。 解决方案: • 数据融合:通过数据引入功能,将各渠道数据沉淀至数据仓库内,丰富基础数据。 • 数据建模:通过数据建模及代码自动化生成功能,以会员为中心,构建完整的会员数据模型,集成会员属性、统计指标等数据。 • 主题服务:通过数仓即席查询功能,面向应用,自动输出会员主题的汇总数据模型,高效完成进一步的会员日报分析、会员门户搭建等。 价值: • 数据建设统一:数据标准规范定义。 • 数据研发提效:自动化代码生成。 • 资产管理便利:数据丰富融通,主题化服务更智能。 推荐搭配组合:Dataphin + Quick BI + MaxCompute • Quick BI详情请参见什么是Quick BI。 • MaxCompute详情请参见什么是MaxCompute。 业务板块 定义数据仓库的名称和业务空间,以企业内一个相对独立的业务为分配单元。例如,如果业务涉及零售、文娱,且系统间相对独立,则需要构建两个业务板块,即零售、文娱。如果业务仅涉及零售,且业务内的系统间隔离较少,则只需要构建一个业务板块,即零售。 公共定义 定义企业构建数据所需的全局概念对象或参数,以保证全局概念统一。当定义完成后,系统内其他指标(例如派生指标)可以按需统一、通用化引用这些对象,例如统计周期。 项目管理 项目是一种物理空间上的划分。项目管理,即用户在数据中台建设过程中,对物理资源及开发人员进行隔离化管理。一个业务板块可以包含多个项目,每个系统成员可以加入多个不同的项目。 物理数据源 存储数据的物理数据库即物理数据源。物理数据源可以作为数据同步传输的上游数据来源,也可以作为数据同步传输的目标数据存储介质。 维度 维度即进行统计的对象。通常情况下,维度是实际存在、不因事件发生就存在的实体。创建维度,即从顶层规范业务中的实体(主数据),并保证实体的唯一性。 业务过程 业务过程即业务活动中的所有事件。创建业务过程,即从顶层规范业务中事务内容的类型及唯一性。 维度逻辑表 维度逻辑表与维度一一对应,是通过丰富维度中的属性信息构建形成的。创建维度逻辑表,即完成公共对象明细数据设计及加工处理,从而便于提取业务中对象的明细数据。 事实逻辑表 事实逻辑表与业务过程对应,是通过丰富业务过程的属性及度量信息构建形成的。创建事实逻辑表,即完成公共事务明细数据设计及加工处理,从而便于提取业务中事务的明细数据。 业务限定 统计的业务范围,筛选出符合业务规则的记录(类似于SQL中where后的条件,不包括时间区间)。 指标 指标分为原子指标和派生指标。 • 原子指标:对指标统计口径(即计算逻辑)、具体算法的一个抽象,例如支付金额。 • 派生指标:业务中常用的统计指标。派生指标=原子指标+业务限定+统计周期+统计粒度。例如,自然周、会员、采用优惠券支付的订单。 统计粒度 统计分析的对象或视角,定义数据需要汇总的程度,可以理解为聚合运算时的分组条件(类似于SQL中group by的对象)。粒度是维度的一个组合,指明您的统计范围。例如,某个指标是某个卖家在某个省份的成交额,则粒度就是卖家、省份这两个维度的组合。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。