【数据篇】33 # 可视化数据处理的一般方法是什么?

简介: 【数据篇】33 # 可视化数据处理的一般方法是什么?

说明

【跟月影学可视化】学习笔记。




数据可视化的一般过程


  1. 先看有什么样的数据:分析真实数据
  2. 然后看想从数据中了解什么信息:获取想要的信息
  3. 再决定使用何种可视化方式呈现:为数据选择正确的呈现形式
  4. 最后看展示的效果怎么样,是否有意义:了解数据背后有价值的内容




实战演练:对公园中的游客进行数据可视化


这里使用上一节的例子进行实战演练:数据还是那些,里面有时间、地点和性别。

[{
  "x": 456,
  "y": 581,
  "time": 12,
  "gender": "f"
}, {
  "x": 293,
  "y": 545,
  "time": 12,
  "gender": "m"
}, {
...
}]


  • 第一步:假设我们想了解公园一天中的游客变化规律
  • 第二步:需要统计不同时间段公园内人数
  • 第三步:要呈现游客在不同时间段的变化规律,使用折线图来呈现


<!DOCTYPE html>
<html lang="en">
    <head>
        <meta charset="UTF-8" />
        <meta name="viewport" content="width=device-width, initial-scale=1.0" />
        <title>公园24小时游客人数变化图</title>
        <style>
            html,
            body {
                width: 100%;
                height: 100%;
            }
            #container {
                width: 600px;
                height: 600px;
                border: 1px dashed #fa8072;
            }
        </style>
    </head>
    <body>
        <script src="https://d3js.org/d3.v6.js"></script>
        <script src="https://unpkg.com/spritejs@3/dist/spritejs.min.js"></script>
        <div id="container"></div>
        <script>
            const { Scene, Sprite, Polyline, SpriteSvg } = spritejs;
            (async function () {
                const data = await (await fetch("./data/park-people.json")).json();
                // 用到 d3.rollups 它可以对数据进行分组,然后汇总
                const dataset = d3
                    .rollups(
                        data,
                        (v) => v.length,
                        (d) => d.time
                    )
                    .sort(([a], [b]) => a - b);
                // 假设公园是早晨 6 点开门,晚上 22 点关门,此时游客数为0
                dataset.unshift([6, 0]);
                dataset.push([22, 0]);
                console.log(dataset);
                const scene = new Scene({
                    container,
                    width: 600,
                    height: 600,
                    displayRatio: 2,
                });
                const fglayer = scene.layer("fglayer");
                // 把数据转换成要显示的折线上的点坐标
                const points = [];
                dataset.forEach((d, i) => {
                    const x = 20 + 20 * d[0];
                    const y = 300 - d[1];
                    points.push(x, y);
                });
                // 用 SpriteJS 创建 Polyline 元素,把这个折线点坐标传给它
                const p = new Polyline();
                p.attr({
                    points,
                    lineWidth: 4,
                    strokeColor: "salmon",
                    smooth: true,
                });
                fglayer.append(p);
                // 创建坐标轴
                // 设置 domain 从 0 到 24,表示一天的 24 个小时,range 从 0 到 480,表示占据 480 像素宽度。
                const scale = d3.scaleLinear().domain([0, 24]).range([0, 480]);
                // 通过 d3.axisBottom 高阶函数,用创建的 scale 来生成一个具体的坐标轴算子 axis
                const axis = d3
                    .axisBottom(scale)
                    .tickValues(dataset.map((d) => d[0]));
                const axisNode = new SpriteSvg({
                    x: 20,
                    y: 300,
                    flexible: true,
                });
                d3.select(axisNode.svg)
                    .attr("width", 600)
                    .attr("height", 60)
                    .append("g")
                    .call(axis);
                axisNode.svg.children[0].setAttribute("font-size", 20);
                fglayer.append(axisNode);
            })();
        </script>
    </body>
</html>


第四步:大致就得到了一天中游园人数的变化趋势,这对公园来说是有一些参考价值的。

f454eabc955f4fd399ec8b587619768a.png



目录
相关文章
|
Kubernetes 网络协议 网络安全
提升你的云技能:深入了解CKA认证之k8s升级秘籍!
提升你的云技能:深入了解CKA认证之k8s升级秘籍!
335 0
|
安全 Java
安装burp2022 --illegal-access=permit
安装burp2022 --illegal-access=permit
240 0
|
机器学习/深度学习 搜索推荐 测试技术
【王喆-推荐系统】评估篇-(task2)推荐模型评估指标
准确率 (Accuracy) 是指分类正确的样本占总样本个数的比例。
1851 0
【王喆-推荐系统】评估篇-(task2)推荐模型评估指标
|
12月前
|
域名解析 SQL 前端开发
如何使用CMS来搭建一个网站?
在如今的时代,拥有一个网站成为每一家企业展现形象、拓展业务、传递信息的重要途径。网站在互联网上吸引潜在客户、合作伙伴。对于大多数希望自行建设网站的企业来说,内容管理系统(CMS)成为了理想选择。
433 8
|
12月前
|
机器学习/深度学习 API
机器学习入门(七):线性回归原理,损失函数和正规方程
机器学习入门(七):线性回归原理,损失函数和正规方程
|
存储 监控 Java
使用Java实现实时数据处理系统
使用Java实现实时数据处理系统
165 11
|
8月前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
本书介绍了如何将Python与Excel结合使用,以提升数据分析和处理效率。内容涵盖Python入门、pandas库的使用、通过Python包操作Excel文件以及使用xlwings对Excel进行编程。书中详细讲解了Anaconda、Visual Studio Code和Jupyter笔记本等开发工具,并探讨了NumPy、DataFrame和Series等数据结构的应用。此外,还介绍了多个Python包(如OpenPyXL、XlsxWriter等)用于在无需安装Excel的情况下读写Excel文件,帮助用户实现自动化任务和数据处理。
|
网络协议 安全 网络安全
ARP协议详解及其工作原理
【8月更文挑战第31天】
1224 0
|
机器学习/深度学习 算法 数据可视化
决策树算法:从原理到实践的深度解析
决策树算法:从原理到实践的深度解析
378 0
|
数据采集 资源调度 算法
【数据挖掘】十大算法之K-Means K均值聚类算法
K-Means聚类算法的基本介绍,包括算法步骤、损失函数、优缺点分析以及如何优化和改进算法的方法,还提到了几种改进的K-Means算法,如K-Means++和ISODATA算法。
1265 4