【数据篇】32 # 如何选择合适的方法对数据进行可视化处理?

简介: 【数据篇】32 # 如何选择合适的方法对数据进行可视化处理?

说明

【跟月影学可视化】学习笔记。



从原始数据中过滤出有用的信息

下面通过航拍公园人群分布例子,按照某些属性对数据进行过滤,再将符合条件的结果展现出来。

数据来源:https://github.com/akira-cn/graphics/blob/master/data/park-people/data.json

[{
  "x": 456,
  "y": 581,
  "time": 12,
  "gender": "f"
}, {
  "x": 293,
  "y": 545,
  "time": 12,
  "gender": "m"
}, {
  "x": 26,
  "y": 470,
  "time": 12,
  "gender": "m"
}, {
  "x": 254,
  "y": 587,
  "time": 12,
  "gender": "m"
}, {
  "x": 385,
  "y": 257,
  "time": 8,
  "gender": "m"
}, 
...]


上面数据里数组中的每一项表示一个游客,x、y 是拍摄位置,time 是时间,gender 是性别。

<!DOCTYPE html>
<html lang="en">
    <head>
        <meta charset="UTF-8" />
        <meta name="viewport" content="width=device-width, initial-scale=1.0" />
        <title>游客散点图</title>
        <style>
            #main {
                width: 500px;
                height: 500px;
                position: absolute;
                border: 1px dashed #fa8072;
            }
            #main > * {
                position: absolute;
                left: 0;
                top: 0;
                width: 100%;
                height: 100%;
            }
            #main .landmark {
                position: absolute;
                line-height: 200px;
                width: 200px;
                height: 200px;
                border-radius: 50%;
                text-align: center;
                font-size: 32px;
                color: #fff;
            }
            #main .landmark1 {
                background: #daa520;
            }
            #main .landmark2 {
                left: 260px;
                background: #fa8072;
            }
            #main .landmark3 {
                top: 260px;
                background: #6a5acd;
            }
            #main .landmark4 {
                top: 260px;
                left: 260px;
                background: #2e8b57;
            }
        </style>
    </head>
    <body>
        <div id="main">
            <div>
                <div class="landmark landmark1">广场</div>
                <div class="landmark landmark2">休闲区</div>
                <div class="landmark landmark3">游乐场</div>
                <div class="landmark landmark4">花园</div>
            </div>
            <canvas width="600" height="600"></canvas>
        </div>
        <script>
            const canvas = document.querySelector("canvas");
            const { width, height } = canvas;
            function draw(data, filter = null) {
                if (filter) data = data.filter(filter);
                const context = canvas.getContext("2d");
                for (let i = 0; i < data.length; i++) {
                    const { x, y, gender } = data[i];
                    context.fillStyle =
                        gender === "f"
                            ? "rgba(255, 0, 0, 0.4)"
                            : "rgba(0, 0, 255, 0.4)";
                    context.beginPath();
                    const spot = context.arc(x, y, 10, 0, Math.PI * 2);
                    context.fill();
                }
            }
            fetch("./data/park-people.json")
                .then((res) => {
                    return res.json();
                })
                .then((data) => {
                    // draw(data, ({ time }) => time === 8);
                    draw(data, ({ time }) => time === 12);
                    // draw(data, ({ time }) => time === 18);
                    // draw(data, ({ time }) => time === 20);
                });
        </script>
    </body>
</html>

我们可以通过过滤不同的时间段,看到人群的分布情况,比如下面是12点的游客散点图

image.png




强化展现形式让用户更好地感知


除了合理的数据分析以外,强化展现形式可以让用户更好地感知数据表达的内容。

比如项目:北京空气质量2013-2018,用照片跟色条,强化了用户的直观认知


image.png





将信息的特征具象化


有时只需要把数据的特征抽象和提取出来,再把代表数据最鲜明的特征,用图形化、令人印象深刻的形式呈现出来即可。


比如:Matt Might 教授绘制的图解博士是什么?


image.png



Manu Cornet 的组织架构图,用非常形象的方法绘制出了各个知名公司的组织架构差异。


c1312e36fec44d56bf973726cb7e37db.png



目录
相关文章
|
23小时前
|
存储 缓存 分布式数据库
数据库性能优化方向的三大类别
【6月更文挑战第6天】本文介绍了数据库优化策略,包括集中式数据库的反规范化设计(如增加冗余列、派生列、重组合表、水平和垂直分表)和数据一致性保障;这些方法旨在提升性能、确保数据安全和适应大规模数据场景。
12 1
数据库性能优化方向的三大类别
|
21天前
|
数据可视化 数据挖掘 大数据
如何选择合适的数据可视化工具?
【5月更文挑战第17天】如何选择合适的数据可视化工具?
43 2
|
23天前
|
存储 搜索推荐 数据库
如何选择合适的矢量数据库:选型指南与案例分析
【4月更文挑战第30天】面对众多矢量数据库,如何选择合适的?本文提供了一份选型指南和案例分析。首先,明确业务需求,如推荐系统、图像检索等场景的不同需求;其次,评估数据量,大型项目需选择支持分布式架构的数据库;再者,关注查询性能、技术成熟度和成本。案例中,电商企业选用Faiss实现高效推荐,而互联网公司则因大规模图像检索选择了Milvus,后者以其扩展性和准确性脱颖而出。选择矢量数据库需综合考虑,结合实际以找到最佳匹配。
|
10月前
|
数据采集 缓存 数据挖掘
GATK4标准分析流程 丨如何选择合适的线程和内存大小?数据预处理方法与注意事项
GATK4标准分析流程 丨如何选择合适的线程和内存大小?数据预处理方法与注意事项
|
11月前
|
存储 容灾 NoSQL
如何选择合适的分布式ID生成方案?
如何选择合适的分布式ID生成方案?
65 0
|
存储 运维 分布式计算
数据分析和数据开发的区别 - 初始
数据分析和数据开发的区别 初始 数据分析(DA:Data Analysis)和数据开发/数据仓库工程师(DE:Data Extraction)究竟有什么区别,工作职责和工作内容上的差异是什么?
415 0
|
存储 算法 NoSQL
想要实现在时序场景下“远超”通用数据库,需要做到哪几点?
近年来,随着物联网技术和市场的快速发展、企业业务的加速扩张,时序数据的处理难题也越来越受到行业和企业的重视,时序场景下通用型数据库步履维艰,各种时序数据库产品应运而起。但是,做一个优质的时序数据库真的很容易吗?本篇文章将从数据库开发者的角度,解剖时序场景下的数据处理需求、分析时序数据库设计思路,给到读者一些硬核技术思考。
156 0
|
存储 缓存 安全
浅析如何选择合适的BlueHost主机方案
BlueHost是知名美国主机商,致力于为全球用户提供稳定可靠的IDC解决方案,口碑在业内相当不错。近年来为了让中国市场客户有更好的服务体验,BlueHost开通了中文站和中文客服。   目前BlueHost中文站提供多种主机租用方案,基本能够满足各类网站建设需求。
1765 0

热门文章

最新文章