用DataV Atlas探索杭州美食

本文涉及的产品
数据可视化DataV,5个大屏 1个月
可视分析地图(DataV-Atlas),3 个项目,100M 存储空间
简介: 本指南介绍如何使用DataV Atlas进行数据可视化。首先,通过链接领取试用额度并登录产品控制台。控制台包含示例数据,如“hangzhou_poi_sample”和“hangzhou_districts”。通过简单几步创建地理分析项目,可对数据进行样式配置。示例分析包括各区美食偏好、高评分火锅店定位及杭州美食分布情况,通过SQL查询和可视化技术,帮助理解数据背后的有趣现象。更改底图样式和添加SQL数据源进一步增强分析效果。

登录产品控制台
1、领取DataV Atlas试用额度 https://free.aliyun.com/?searchKey=atlas;
2、打开产品控制台地址:https://atlas.datav.aliyun.com/,使用阿里云账号登录即可
查看数据中心样例数据
控制台登录默认进入的就是数据中心页,Atlas 数据中心提供了两个默认数据连接:
• Atlas 演示数据库:存放 Atlas 官方提供的一些演示案例数据,会不定期更新进一些数据集供用户试用
• 体验空间:免费提供 100MB 空间供用户上传自有的数据来体验产品功能
{F713E438-A978-42DE-9839-9048B39D3701}.png
本次实验数据两张表存放于 Atlas 演示数据库的 public 文件夹下:
• "public"."hangzhou_poi_sample":杭州餐饮娱乐店样例数据,包括分类、地理位置和消费者评价等
• "public"."hangzhou_districts":杭州市行政区划数据,包括行政区划名称、行政区划代码、行政区划级别、行政区划中心点经纬度、行政区划边界等
在列表中点击表名称即可预览该数据,支持地图模式以及数据表模式预览,支持查看表记录数量以及存储占用
{3CB2B00F-2D43-4635-BCDF-5E89E3297032}.png
{95FD59B3-C52D-4AEC-BF27-4BA6B3804CDF}.png
{B135D14B-74A8-48C6-9A05-34BD12AD3459}.png
创建可视化项目

  1. 下面我们基于这两份样例数据开始我们的杭州美食探索之旅,点击顶部菜单从数据中心切换到 我的项目 ,点击 新建地理分析项目
    {2D33946E-E729-4EA1-B8FF-C17BEC83A324}.png
    2.默认会弹出添加数据对话框,选择 Atlas 演示数据库 下 "public"."hangzhou_poi_sample" 表添加到项目
    {544E98A2-37F8-4954-B870-F30F2977C5FF}.png
    3.添加至项目后会默认创建出一个可视化图层,点击左侧图层列表可以对图层进行样式配置
    {CEBCF843-8698-447D-8EF4-3A70D6D1C772}.png
    下面我们利用 SQL 来对这份样例数据进行一些好玩有趣的分析:
    1、杭州各个区的吃货都爱吃些啥?
    接下来为大家演示一下如何通过将行政区数据表与美食兴趣点数据表进行关联分析
    新建一个 SQL 数据源,添加如下 SQL,这段 SQL 通过聚合出每个区数量最多的二级分类类别作为该区域的标签,并排除小吃快餐、水果生鲜、面馆以及本帮江浙菜
    WITH CategoryCounts AS (SELECT b.name AS 区域名称,
                            p.二级分类        AS 二级分类,
                            COUNT(p.二级分类) AS 类型数量,
                            b.geom            as geom
                     FROM public.hangzhou_districts b
                              JOIN public.hangzhou_poi_sample p ON ST_Contains(b.geom, p.geom)
                     WHERE 一级分类 = '美食'
                       AND 二级分类 not in ('小吃快餐', '水果生鲜', '面馆', '本帮江浙菜')
                     GROUP BY b.name, p.二级分类, b.geom),
    
    RankedCategories AS (SELECT 区域名称,
                              二级分类,
                              类型数量,
                              row_number() OVER (PARTITION BY 区域名称 ORDER BY 类型数量 DESC) as rank,
                              geom
                       FROM CategoryCounts)
    
    SELECT 区域名称,
    二级分类,
    类型数量,
    区域名称 || '
    ' || '美食标签:' || 二级分类 as 标注字段,
    geom
    
    FROM RankedCategories
    WHERE rank = 1;
    {56182727-C047-40DB-B977-B456494E89B8}.png
    通过二级分类标签的类别进行着色还是不够直观,我们调整一下 SQL 语句,调整输出的CategoryCounts 中的 b.geom(行政区的几何字段) 字段为ST_PointOnSurface(b.geom)得到行政区内的标注点
    WITH CategoryCounts AS (SELECT b.name AS 区域名称,
                            p.二级分类        AS 二级分类,
                            COUNT(p.二级分类) AS 类型数量,
                     ST_PointOnSurface(b.geom) as geom --计算标注点
                     FROM public.hangzhou_districts b
                              JOIN public.hangzhou_poi_sample p ON ST_Contains(b.geom, p.geom)
                     WHERE 一级分类 = '美食'
                       AND 二级分类 not in ('小吃快餐', '水果生鲜', '面馆', '本帮江浙菜')
                     GROUP BY b.name, p.二级分类, b.geom),
    
    RankedCategories AS (SELECT 区域名称,
                              二级分类,
                              类型数量,
                              row_number() OVER (PARTITION BY 区域名称 ORDER BY 类型数量 DESC) as rank,
                              geom
                       FROM CategoryCounts)
    
    SELECT 区域名称,
    二级分类,
    类型数量,
    区域名称||'
    '||'美食标签:'||二级分类 as 标注字段,
    geom
    
    FROM RankedCategories
    WHERE rank = 1;
    再次添加一个 SQL 数据源,粘贴上以上 SQL
    我们将半径置为 0,打开文字标签,选择标注字段作为标签,调整一下字号和颜色,这样叠加后就可以清晰的看出各个行政区美食最多的二级分类是哪些类型了
    {855C1F1B-84B8-4FF0-857F-ACEEBDE41C26}.png
    2、高端大气上档次的火锅去哪吃?
    如果想请吃火锅又想请吃点评分高、上档次并且性价比高,我们该如何利用 DataV Atlas 进行分析呢?很简单,我们可以通过以下 SQL 筛选出美食分类中的火锅店,然后选择评分大于四分,人均消费在 200 以上的
    SELECT
    "店名",
    "人均消费",
    "评分",
    geom -- 别忘记带上
    FROM
    "public"."hangzhou_poi_sample"
    WHERE
    "一级分类" = '美食'
    AND "二级分类" = '火锅'
    AND "评分" > 4
    AND "人均消费" > 200
    将上述 SQL 创建一个新的自定义 SQL 数据源,我们使用纯色带点透明作为颜色,根据评分作为半径的映射字段,映射区间设置为 5-15,再调整一下描边颜色和粗细
    {BC5B5FF2-C2B0-4AD4-9221-79C14C2E7935}.png
    我们选择这个图层点击右侧的更多操作按钮,选择复制图层,创建一个新的图层
    {866AD5BD-AD1F-4433-A5C3-6B3ACD407339}.png
    再对复制的图层,调整半径的映射为 人均消费 字段,再调整一下颜色为跟之前的图层对比度高的颜色
    {67BF0ABF-7905-4607-94BE-D4F96EE6B107}.png
    我们放大看一下,可以看到绿色的为人均消费,底下蓝色的为评分,我们想要找的高性价比自然是评分高人均低的,也就是环状的,小圈在上大圈在下
    {AA1DA419-A66C-42BE-A51B-35C973D56727}.png
    这样看起来还不是很清晰,我们再基于这个复制一个图层来作为标注图层,设置半径为 0 不显示点,打开标注选项,选择店名作为标签字段,调整标注的颜色和字号大小,记得打开顶部的 碰撞检测 开关来使标注更加清晰明了,还是很明显看出这些火锅店大部分都是海鲜火锅,毕竟海鲜也确实贵一些
    {39882664-EC21-45A8-985F-09E0CBAB293B}.png
    3、为啥杭州被称为“美食荒漠”?背后成因的数据分析
    更改底图
    为了使得数据可视化的效果更明显,我们可以点击左侧的地图工具按钮来将默认的远山黛白色底图更改为雅士灰深色底图,并去掉底图默认的标注
    {C4303470-9585-4C3F-B3E7-E2FD0CDE504E}.png
    添加 SQL 数据源
    刚刚我们通过直接选择表的形式很方便地添加数据库中的任意一张空间表进行可视化,现在我们点击左侧数据源列表,通过底部的添加数据按钮以自定义 SQL 编写的方式来进行更强大的分析
    {D0F49FD8-FBF9-460E-91A3-47690B2EBAE3}.png
    在底部弹出的 SQL 编辑器内添加以下 SQL 来计算杭州范围 500 米半径蜂窝网格中每个格子内的娱乐美食店铺数量,点击运行按钮
    -- 计算杭州范围 500 米半径蜂窝网格中每个格子内的美食店铺数量
    SELECT
    count(*) as 店铺数量,
    hexes.geom as geom
    FROM ST_HexagonGrid(
          500.0 / 111000.0,--使用的的坐标系单位是度,1度约等于111千米,这里的意思是使用半径为500米的网格
          ST_SetSRID(ST_EstimatedExtent('public', 'hangzhou_poi_sample', 'geom')::geometry, 4326)
    
    ) AS hexes
      INNER JOIN
    
    public.hangzhou_poi_sample AS p
    ON ST_Intersects(p.geom, hexes.geom) AND 一级分类 = '美食'
    GROUP BY hexes.geom;
    {69F8FA82-AC7F-432E-8C9F-7DB75447328D}.png
    对店铺数量进行颜色映射可视化
    在左侧图层列表选择生成的蜂窝多边形的图层,点击颜色右侧的数据映射按钮,选择店铺数量字段进行映射,映射类型选择连续映射,预设模式我们选择极值映射(方便我们观察高值和低值数据对比),在色板中选择合适的色板,我们再将描边调细,颜色设置一些半透明来更清楚的看到填充颜色的映射规律,通过缩放底图可以很清楚的看到杭州的美食都聚集在哪些区域
    {01178838-762C-4A05-A700-DF80D5031DE4}.png
    对网格内人均消费进行聚合可视化
    我们修改一下上述 SQL,再次创建一个自定义 SQL 数据源
    SELECT
    hexes.geom as geom,
    AVG(人均消费) as 人均消费
    FROM ST_HexagonGrid(
          500.0 / 111000.0,--使用的的坐标系单位是度,1度约等于111千米,这里的意思是使用半径为500米的网格
          ST_SetSRID(ST_EstimatedExtent('public', 'hangzhou_poi_sample', 'geom')::geometry, 4326)
    
    ) AS hexes
      INNER JOIN
    
    public.hangzhou_poi_sample AS p
    ON ST_Intersects(p.geom, hexes.geom) AND 一级分类 = '美食' AND 人均消费 IS NOT NULL
    GROUP BY hexes.geom;
    这次我们选择三维拉伸面的展现形式来展示,为避免干扰可以暂时关闭其他图层的显示(通过图层列表项右侧的👀进行控制)
    {DC186EF4-1C4D-4E8C-A4B3-5005CD7AE042}.png
    卷帘对比
    点击右上角视图按钮可以切换分屏视图以及滑动视图进行对比分析
    {FFD7B0E2-D693-4398-A9BD-C842E1593012}.png
    {7A87DA3B-36E8-4F45-BE51-99F700C6A2A5}.png
    通过分析我们可以发现,杭州美食分布是非常不均衡的,人口和GDP大区-余杭区,美食数量少且高分店铺少,鉴于余杭区是互联网公司的聚集地,网络声量最大,由此造成了“杭州是美食荒漠”的网络论断!
相关实践学习
Github实时数据分析与可视化
基于Github Archive公开数据集,将项目、行为等20+种事件类型数据实时采集至Hologres进行分析,并搭建可视化大屏。
阿里云实时数仓实战 - 项目介绍及架构设计
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
目录
相关文章
|
3月前
|
SQL 数据可视化 定位技术
见证数据的视觉奇迹——DataV Atlas
阿里云DataV的DataV-Atlas是一款专注于地理数据可视化的工具,提供时空数据分析和地图发布功能,适合快速创建地图并分享。与ArcGIS Server相比,DataV.GeoAtlas更侧重于数据可视化和云服务集成,适合非专业用户,而ArcGIS Server是全面的GIS服务平台,适合复杂分析和定制化应用。用户可通过阿里云免费试用DataV-Atlas,体验包括数据上传、地图制作和分析在内的功能。
见证数据的视觉奇迹——DataV Atlas
|
3月前
|
数据可视化 搜索推荐 atlas
DataV Atlas深度解析与实战应用:打造个性化地理信息可视化
阿里云DataV的Atlas功能专注于地理信息可视化,提供范围选择、边界生成和层级展示等工具,助用户轻松创建专业地图应用。通过代码示例展示了如何用Geo组件展示中国省份销售数据,强调了数据安全和性能优化的重要性。DataV Atlas简化了复杂地理信息的展示,提升了数据洞察的直观性和美感。【6月更文挑战第19天】
508 3
|
3月前
|
SQL 数据可视化 atlas
用DataV Atlas探索杭州美食
DataV 可视分析地图 Atlas 作为一款面向时空地理数据的可视分析工具,支持海量时空数据的快显渲染和实时分析,能够通过 SQL 分析方式对用户的海量时空数据进行实时渲染和多维分析,帮助用户快速构建自己的地理分析地图,挖掘时空数据价值。 下面通过一份杭州的美食娱乐兴趣点数据在 DataV Atlas 产品上为大家探索一下所谓的美食荒漠城市到底有没有美食?
51484 8
|
15天前
|
人工智能 数据可视化 数据挖掘
|
数据可视化 安全 数据挖掘
阿里云datav介绍以及如何购买
阿里云Datav是阿里巴巴集团推出的数据可视化产品,旨在为用户提供全面、高效、便捷的数据分析和可视化解决方案。它具有丰富的功能和特点,能够满足用户对于数据处理、分析和展示的各种需求。
|
监控 数据可视化 大数据
阿里云DataV数据可视化简介和购买流程
数据可视化DataV是阿里云一款数据可视化应用搭建工具,旨让更多的人看到数据可视化的魅力,帮助非专业的工程师通过图形化的界面轻松搭建专业水准的可视化应用,满足您会议展览、业务监控、风险预警、地理信息分析等多种业务的展示需求。
|
数据可视化
阿里云产业智能OpenTrek——DataV数字孪生开放平台
DataV数字孪生开放平台是阿里云数据可视化领域的全能产品,该产品拥有强大的数字孪生场景覆盖能力及渲染能力,能够实现全场景要素实时联动,满足客户业务需求。
阿里云产业智能OpenTrek——DataV数字孪生开放平台
|
SQL 数据可视化 数据库
使用阿里云dataV实现大屏自动轮播
使用阿里云dataV实现大屏自动轮播进行动态展示
1675 0
使用阿里云dataV实现大屏自动轮播
|
数据可视化 双11
阿里云金秋云创季 DataV双11限时活动低至65折
阿里云金秋云创季重磅来袭,阿里云客户专享DataV数据可视化金秋云创季限时特惠,9.9元即可开通专业版试用,更有企业版/专业版超低折扣优惠,快来看看吧!
553 0
|
数据可视化 安全 大数据
阿里云DataV完成中国信通院首批数据可视化产品评测
2022年2月24日,在中国信通院组织的第十四批“可信大数据”产品能力评测中,阿里云计算有限公司顺利完成了首个数据可视化产品基础能力评测~
2468 4
阿里云DataV完成中国信通院首批数据可视化产品评测