【视频特辑】数据分析师必备!快速制作一张强大好用的大宽表

简介: 随着企业数字化进程的逐步推进,在日常经营过程当中会沉淀下越来越多的数据信息。每当想做数据分析的时候,就会发现想要的指标分散在不同的数据源、数据集、数据表当中。Quick BI的数据关联功能,可以帮助数据分析师快速将指标进行汇聚,形成一张强大好用的大宽表。一起来看看Quick BI是如何做到的吧!

随着企业数字化进程的逐步推进,在日常经营过程当中会沉淀下越来越多的数据信息。

每当想做数据分析的时候,就会发现想要的指标分散在不同的数据源、数据集、数据表当中。

Quick BI的数据关联功能,可以帮助数据分析师快速将指标进行汇聚,形成一张强大好用的大宽表。

一起来看看Quick BI是如何做到的吧!


封面图片.jpg

点击查看完整视频



数据集关联建模

您需要通过不同报表中都具备的相同字段来进行关联。如「demo_订单信息明细表」和「demo_渠道信息维度表」中都包含共同字段「渠道ID」,选择「渠道ID」来进行数据关联,就可以获取包含订单信息和渠道信息的完整表单。方便后续分析数据。

  1. 将目标表单拖入编辑区
  2. 在自动弹出的设置界面选择关联字段和关联模式
  3. 点击确定并保存数据集

001.jpg

002.jpg


不同关联模式的区别

◼左外连接(left join):以左表为基准,查询结果中包含左表全部数据,右表匹配数据不存在时用null代替;

◼右外连接(right join):以右表为基准,查询结果中包含右表全部数据,左表匹配数据不存在时用null代替;

◼内连接(inner join):通过id将左表和右表连接起来产生一个新表,新表是由这个表的交集部分组成;

◼全连接(full join):左连接和右连接的一个合集,包含左表和右表的全部数据,匹配不上的显示为null。

003.png


维度值二次分组

分组维度用于将维度值分组的场景,例如对年龄字段分组,分为未成年、青年、中年、老年这几个大区,分别查看每个年龄段人员的疫苗接种情况。

  1. 在数据预览区域,单击新建分组维度
  2. 在新建分组字段对话框,按照以下步骤配置后,单击确定。(支持应用在地理分组、年龄分组、日期分组等场景)

004.png

005.png

006.png

007.png





阿里云数据中台是阿里巴巴数据中台唯一商业化输出,以数据中台方法论为内核,构建起”快、准、全、统、通“的智能大数据体系。

阿里云数据中台产品矩阵是以Dataphin为基座,以Quick系列为业务场景化切入:

  • - Dataphin,智能数据建设与治理
  • - Quick BI,数据可视化分析
  • - Quick Audience,一站式消费者运营和管理
  • - Quick Tracking,全域行为洞察
  • - Quick Stock, 智能货品运营
  • - Quick Decision,风控决策数字引擎

目前正对外输出系列解决方案,包括通用数据中台解决方案、零售数据中台解决方案、金融数据中台解决方案、互联网数据中台解决方案等。

相关实践学习
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
相关文章
|
存储 程序员 C语言
动态存储方式与静态存储方式
在编程中,数据的存储方式对于程序的性能、内存使用以及代码的可维护性都有着至关重要的影响。其中,动态存储方式和静态存储方式是两种常见的数据存储方式。本文将探讨这两种存储方式的区别、应用场景,并附上相应的代码示例。
773 1
|
缓存 负载均衡 Java
Java分布式系统架构设计与实现
【4月更文挑战第2天】在快速发展的互联网时代,Java分布式系统成为应对复杂业务和高用户量的首选。通过服务化拆分、注册发现、负载均衡和缓存等技术,如Spring Cloud和Dubbo,开发者能构建高效、可靠、可扩展的系统。服务注册与发现确保服务间通信,负载均衡分配请求,分布式缓存如Redis提升性能。面对数据一致性和监控等挑战,Java提供工具解决,助力打造现代分布式应用。
900 2
Java分布式系统架构设计与实现
|
分布式计算 资源调度 Hadoop
【赵渝强老师】基于ZooKeeper实现Hadoop HA
本文介绍了如何在4个节点(bigdata112、bigdata113、bigdata114和bigdata115)上部署HDFS高可用(HA)架构,并同时部署Yarn的HA。详细步骤包括环境变量设置、配置文件修改、ZooKeeper集群启动、JournalNode启动、HDFS格式化、ZooKeeper格式化以及启动Hadoop集群等。最后通过jps命令检查各节点上的后台进程,确保部署成功。
464 0
|
弹性计算 固态存储 Linux
阿里云服务器、轻量应用服务器、gpu云服务器收费标准与实时活动价格参考
云服务器ECS、轻量应用服务器和gpu云服务器是阿里云的主要云服务器产品,目前轻量应用服务器2核2G收费标准为60元/月,活动价格只要36元/1年或68元1年,云服务器1核1G包月收费标准最低为24.0元/月,GPU云服务器中gn6i实例4核15G配置月付1681.00/1个月起,gn6v实例8核32G配置月付3817.00/1个月起。本文为大家整理汇总了阿里云服务器、轻量应用服务器、gpu云服务器的最新收费标准与活动价格情况,以表格形式展示给大家,以供参考。
|
人工智能 运维 监控
数字孪生与能源管理:优化电网运营
数字孪生技术通过集成物联网、大数据、AI等先进科技,为实体对象创建虚拟模型,实现实时监控、故障预测与资源优化。在能源管理中,特别是电网运营方面,数字孪生能显著提升系统的稳定性、安全性和效率,推动智能电网建设,优化资源配置,加速应急响应,成为未来能源管理的关键技术。
|
数据采集 前端开发 测试技术
Selenium中定位元素的9种方法
在Selenium中,定位页面元素是自动化测试和网页爬虫的基础。常用的9种元素定位方法包括:ID、Name、Class Name、Tag Name、CSS Selector、XPath、Link Text、Partial Link Text,以及XPath和CSS选择器的组合使用。每种方法各有优劣,建议根据页面的具体情况和元素的属性选择最合适的方法,并使用显式等待确保元素可用。
2006 5
|
应用服务中间件 网络安全 nginx
Nginx ssl双向认证
Nginx ssl双向认证
725 0
Nginx ssl双向认证
|
移动开发 运维 Dart
函数计算助力闲鱼构建云端一体化变成模式,节省30%开发成本
闲鱼是依托阿里电商体系的前台型业务,有非常独特的业务特点和用户诉求,在底层依托阿里系统的同时,在表现层和业务层需要探索适合闲鱼的、并且更加快速灵活的研发体系。
3976 103
|
自然语言处理 网络协议 Apache
RPC与TCP的区别
RPC与TCP的区别
457 0
|
数据采集 运维 安全
构建数据中台的组织架构
著名管理大师钱德勒总结过一个黄金定律:战略决定组织,而组织决定成败。
7392 10
构建数据中台的组织架构