开发者学堂课程【DataWorks一站式大数据开发治理平台精品课程:6.DataWorks 数据分析介绍及实践】与课程紧密联系,让用户快速学习知识
课程地址:https://developer.aliyun.com/learning/course/81/detail/1232
6.DataWorks 数据分析介绍及实践(二)
五、使用演示
1、首先前往阿里云的官网,在搜索框输入dataworks,点击搜索就可以直达,也可以在产品分类大数据位置找到dataworks,点击管理控制台。点击工作空间列表,选择某个工作空间点击进入首页。
2、首页放置两个常用的场景,大数据开发场景,数据分析场景使用的链路。
3、切换到数据分析场景链路,现在可以通过点击卡片进入数据分析模块,也可以通过左上角切换到数据分析模块。
4、数据分析模块的首页,可以看到它分为三大功能,一个是电子表格,是维表,是报表。
5、重点演示是电子表格功能,点击电子表格,可以看到它分为两个部分,中是新建电子表格,下面是全部的电子表格,可以点击新建空白的电子表格,也可以从某个模板新建。
6、下面创建电子表格的列表,点击右上角也可以切换为分享给我的,这里能查看到别人分享给的电子表格的列表,对电子表格会有同命名,转交,克隆,删除的操作。
7、新建电子表格,可以把一些数据导入到电子表格中,可以手动的编辑数据,也可以选择把一些现成的数据导入进来,可以选择导入本地的数据。比方想导入某一个Excel文件,点击选择文件,有一个谷歌应用商店的数据,把它导入进来,点击确认。
8、看到谷歌应用商店的对应用的评分,数据已经被导入进来,拿到数据后,想用数据探查的功能整体查看数据的分布,可以看到有APP字段有187个唯一的值,目录主要是 family 和 tours 分类,至于应用的评分,可以看到是有一些空值存在的,可以把空值给取消掉,这样就可以查看到应用评分分布的情况,包括评论的数量的直方图统计,这里是概览的信息,如果想要更详细的统计信息,可以点击详细模式查看更多的统计的数据。
9、对数据有基本了解后,可以对数据进行透视分析,点击透视可以选择本地的数据进行透视,也可以使用外部数据源透源。先点击第一个狗功能,点击确认。
10、首先查看APP的评分的情况,可以把评分作为行维度,把APP的数量作为指标,可以看到它现在的排序是比较乱的,而且里面有一些空值,这时可以做一些筛选,选择它的评分不等于好,现在就会把空值给筛掉,现在可以看到它排序是乱掉的,再进行排序,rating 等级按照首字母顺序,它是按照012345的排序排的。
11、还可以按照免费应用还是付费应用做透视的分析,可以查看到免费的应用有1231个,而付费的应用有107个,各个不同免费和付费的他们各自的等级评分等级的分布也都可以查看到。
12、怎么从数据源导入数据,并且完成进一步的分析?新建 sheet,点击从数据源查询功能,进入到查询模式,这里是个人视角的查询分析的工作台。
13、要分析的是一张用户画像表,它存在 MaxCompute 里面,找到项目,双击进去,通过搜索找到的那张表 portrait 表。
14、对它进行基本信息的查看,或者是进行数据预览,点击取消,如果需要查询他所有字段,可以直接通过拖拽的方式,一句代码都不用写,直接把它拖到表格中,它就会自动运行查询。可以看到查询结果已经插入到电子表格中。
15、比方想查询女性用户的用户画像,那可以通过双击 gender 字段,它就会自动生成一条sql语句,select from dw demo s td. user_ portrait 202008 where gender,输入女性,点击运行,它就会把这条sql运行结果插入进来,还可以把查询保存下来,这样可以重复的使用文件。下面是个人的查询文件管理的地方,还有运行的历史,通过双击操作可以快速的把这次运行的代码载入到编辑器中。现在已经拿到数据,关闭查询模式。
16、在透视时直接选择某数据源进行透视的操作,选择使用外部数据源,现在要透视的这张表还是用户画像表,选择数据源类型为 MaxCompute,选择对应的工作空间,选择那张表 odps. dw demo. std.user. portrait, 202008,它是一张非分区表,所以不用指定它的分区。
17、现在可以在右侧查看到表的结构,现在开始透视分析,希望把性别放到列维度上,把消费水平和城市水平放到行维度上,根据这些维度对用户的拼音进行分析,再加指标,购物车加购的情况,可以看到城市等级的顺序是有问题的,设置排序,城市等级可以按照首字母的顺序,消费水平可以手动的排序,低、中、高,点击确定。
18、可以看到顺序是对的,这样就得到一张简单的透视表。
19、现在觉得指标的可读性不好,可以给他命令一个名字,中文名购物车,Pv改为浏览量。
20、现在是对9月份的用户画像表进行分析,如果10月份时要做相同的这样透视分析,要怎么把的这些操作复用到10月份的数据上呢?可以在数据源点击编辑,把数据表更改为10月份的那张表就可以,或者如果表是分区表,可以只去修改它的分区,点击确定,数据就会刷新为对应更新过的数据。
21、把的透视表分享给其他人,可以点击右上角的分享,指定其他人并且给他赋予相应的权限,他就可以查看或者编辑透视表。对应的同学他是可以在他的电子表格的页面看到。