【数据篇】33 # 可视化数据处理的一般方法是什么?

简介: 【数据篇】33 # 可视化数据处理的一般方法是什么?

说明

【跟月影学可视化】学习笔记。




数据可视化的一般过程


  1. 先看有什么样的数据:分析真实数据
  2. 然后看想从数据中了解什么信息:获取想要的信息
  3. 再决定使用何种可视化方式呈现:为数据选择正确的呈现形式
  4. 最后看展示的效果怎么样,是否有意义:了解数据背后有价值的内容




实战演练:对公园中的游客进行数据可视化


这里使用上一节的例子进行实战演练:数据还是那些,里面有时间、地点和性别。

[{
  "x": 456,
  "y": 581,
  "time": 12,
  "gender": "f"
}, {
  "x": 293,
  "y": 545,
  "time": 12,
  "gender": "m"
}, {
...
}]


  • 第一步:假设我们想了解公园一天中的游客变化规律
  • 第二步:需要统计不同时间段公园内人数
  • 第三步:要呈现游客在不同时间段的变化规律,使用折线图来呈现


<!DOCTYPE html>
<html lang="en">
    <head>
        <meta charset="UTF-8" />
        <meta name="viewport" content="width=device-width, initial-scale=1.0" />
        <title>公园24小时游客人数变化图</title>
        <style>
            html,
            body {
                width: 100%;
                height: 100%;
            }
            #container {
                width: 600px;
                height: 600px;
                border: 1px dashed #fa8072;
            }
        </style>
    </head>
    <body>
        <script src="https://d3js.org/d3.v6.js"></script>
        <script src="https://unpkg.com/spritejs@3/dist/spritejs.min.js"></script>
        <div id="container"></div>
        <script>
            const { Scene, Sprite, Polyline, SpriteSvg } = spritejs;
            (async function () {
                const data = await (await fetch("./data/park-people.json")).json();
                // 用到 d3.rollups 它可以对数据进行分组,然后汇总
                const dataset = d3
                    .rollups(
                        data,
                        (v) => v.length,
                        (d) => d.time
                    )
                    .sort(([a], [b]) => a - b);
                // 假设公园是早晨 6 点开门,晚上 22 点关门,此时游客数为0
                dataset.unshift([6, 0]);
                dataset.push([22, 0]);
                console.log(dataset);
                const scene = new Scene({
                    container,
                    width: 600,
                    height: 600,
                    displayRatio: 2,
                });
                const fglayer = scene.layer("fglayer");
                // 把数据转换成要显示的折线上的点坐标
                const points = [];
                dataset.forEach((d, i) => {
                    const x = 20 + 20 * d[0];
                    const y = 300 - d[1];
                    points.push(x, y);
                });
                // 用 SpriteJS 创建 Polyline 元素,把这个折线点坐标传给它
                const p = new Polyline();
                p.attr({
                    points,
                    lineWidth: 4,
                    strokeColor: "salmon",
                    smooth: true,
                });
                fglayer.append(p);
                // 创建坐标轴
                // 设置 domain 从 0 到 24,表示一天的 24 个小时,range 从 0 到 480,表示占据 480 像素宽度。
                const scale = d3.scaleLinear().domain([0, 24]).range([0, 480]);
                // 通过 d3.axisBottom 高阶函数,用创建的 scale 来生成一个具体的坐标轴算子 axis
                const axis = d3
                    .axisBottom(scale)
                    .tickValues(dataset.map((d) => d[0]));
                const axisNode = new SpriteSvg({
                    x: 20,
                    y: 300,
                    flexible: true,
                });
                d3.select(axisNode.svg)
                    .attr("width", 600)
                    .attr("height", 60)
                    .append("g")
                    .call(axis);
                axisNode.svg.children[0].setAttribute("font-size", 20);
                fglayer.append(axisNode);
            })();
        </script>
    </body>
</html>


第四步:大致就得到了一天中游园人数的变化趋势,这对公园来说是有一些参考价值的。

f454eabc955f4fd399ec8b587619768a.png



目录
相关文章
|
3月前
|
数据可视化 数据挖掘
如何利用数据可视化工具来发现处理后数据中的异常或不一致?
在使用这些可视化工具时,需要仔细观察图形中的细节,结合数据的背景和业务知识,来准确判断是否存在异常或不一致。同时,也可以通过交互操作和深入分析来进一步挖掘潜在的问题。
71 2
|
1天前
|
数据挖掘 数据处理 开发者
Pandas高级数据处理:实时数据处理
本文介绍了Pandas在实时数据处理中的应用,涵盖基础概念、常见问题及解决方案。Pandas是Python中强大的数据分析库,支持流式读取和增量更新数据,适用于大规模数据集的处理。通过分块读取、数据类型优化等方法,可有效解决内存不足等问题。文中还提供了代码示例,帮助读者更好地理解和掌握Pandas在实时数据处理中的使用技巧。
33 15
|
4月前
|
机器学习/深度学习 数据采集 数据可视化
如何理解数据分析及数据的预处理,分析建模,可视化
如何理解数据分析及数据的预处理,分析建模,可视化
95 0
|
6月前
|
存储 数据处理 API
数据处理
【8月更文挑战第21天】
59 1
|
9月前
|
数据可视化
用excel来构建柯布-道格拉斯Cobb-Douglas生产函数的可视化
用excel来构建柯布-道格拉斯Cobb-Douglas生产函数的可视化
|
NoSQL Shell Linux
如何使用 Flupy 构建数据处理管道
如何使用 Flupy 构建数据处理管道
191 0
|
JavaScript 数据可视化 前端开发
数据可视化工具的设计与实现的功能展示
数据可视化工具的设计与实现的功能展示
167 0
数据可视化工具的设计与实现的功能展示
|
数据采集 消息中间件 监控
功能介绍数据处理详解|学习笔记
快速学习功能介绍数据处理详解
功能介绍数据处理详解|学习笔记
|
数据可视化 数据挖掘 大数据
Pandas数据分析:快速图表可视化各类操作详解+实例代码(二)
Pandas数据分析:快速图表可视化各类操作详解+实例代码(二)
197 0
Pandas数据分析:快速图表可视化各类操作详解+实例代码(二)
|
数据可视化 前端开发 数据挖掘
Pandas数据分析:快速图表可视化各类操作详解+实例代码(一)
Pandas数据分析:快速图表可视化各类操作详解+实例代码(一)
341 0
Pandas数据分析:快速图表可视化各类操作详解+实例代码(一)

热门文章

最新文章