如何将枯燥的大数据呈现为可视化的图?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

如何将枯燥的大数据呈现为可视化的图?

将数据转化成可视化图表/形,其实一个工具就能完成,碍于工具太多,按照使用场景,暂且将已成熟应用的分为三个层次:

第一层:数据报告、信息图

这里统称信息图。信息图是把数据、信息或知识可视化,必须要有一个清楚准确的解释或表达甚为复杂且大量的信息。

代表人物是新闻界的David McCandless(大卫. 麦克坎德雷斯),曾为《英国卫报》、《连线》、《独立报》等刊物撰稿。常以简洁精美的图像展现复杂抽象资讯,并将不同的数据组合,展现其中的联系。他在TED上曾讲过:

可视化并不局限于数字,概念也同样适用,比如政治倾向图谱。我试图将各种政治倾向融入到图表中,并展示其如何从政府渗透到社会、文化中,对家庭和个人产生影响,继而又反过来影响政治。

比如用图形来表示数值

视线流动,构建时空

信息图的制作:

利用PPT自带的图表,可以制作简洁直观的数据图表,但附上人文花鸟就需要美工设计;

PS+AI+icon,前期规划好表达思路、展示内容、所需素材,之后便大刀阔斧动工组件了。图表的细节,如柱状图的长短依据数据大概等比例量一下。

这一类对数据的维度数量要求都不高,运用的大多是结果数据,侧重点也在于展示。

第二层:实际数据应用

应用类的可视化正如上面所说的,将一堆几百到即使几百万不等的数据展示、分析。对于企业,因为这些数据本身是自己生产经营过程中产生的,能反映历史的状况,总结发展之道,对目前的问题或者未来下一步的决策起到辅助作用。

这样的工具excel能解决,报表工具能解决,BI也能解决,具体细化到什么样的场景不是这里的重点,大家可以在下面评论交流。

通常的制作流程是:导入数据(excel)/连接数据库(本地/服务器)——选择图表(组合)——设定分析维度——美化展示。比如像这种浓浓的带有商业味道的可视化报表(由FineReport制作)

 

 

当然,这样功力的可视化报表需要一定的审美和熟练操作。图中每一块都是一个图表控件,在表单(dashboard)中拖入一个图表控件,选定数据字段,然后搭配组合,排布版型。

第三层:据挖掘、数据连接、关系传递

这个可以理解为从海量数据中挖掘关系。

大致思路:原始数据经过一连串收集、提取、清洗、整理等预处理过程,形成高质量的数据。然后按照需要对数据贴标签分类或者预测,如果要从大量复杂的数据中提取有价值且不易发现的信息还要数据建模。(细节可能各有不同)

比较适用的是一写高级的数据分析挖掘工具以及开源图表控件,如R,如D3。

用R做可视化,比较容易做出漂亮的可视化图表,推荐书籍R Graphics Cookbook,书中有150多个recipes,足够应付大多类型的数据。

D3做图可以定制,美观图图表的丰富性秒杀大多图表控件,但要求的水平有一丢丢高。

最后,再次引用David McCandless的话“炫酷的可视化对于把思想传递给大众又是至关重要的”,切勿一味追求美感,本末倒置。


本文作者:哈士奇不姓哈

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
数据采集 SQL 数据可视化
大数据可视化技巧:借助PowerBI提升数据故事讲述力
【4月更文挑战第8天】Power BI助力大数据可视化,支持多种数据源连接,如SQL Server、Excel,提供数据清洗与转换功能。通过选择合适图表类型、运用颜色和大小强化表达,创建交互式仪表板。讲述数据故事时,注重故事主线设计,利用叙事技巧引导观众,并添加文本说明。分享已完成报告,提升数据驱动决策能力。动手实践,体验Power BI的强大与易用。
212 0
|
7月前
|
SQL 分布式计算 数据可视化
Tableau与大数据:可视化工具在大数据分析中的应用
【4月更文挑战第8天】Tableau是一款领先的数据可视化工具,擅长于大数据分析,提供广泛的数据连接器,支持多源整合。它与Hadoop、Spark等深度集成,实现高效大数据处理。Tableau的拖拽式界面和交互式分析功能使得非技术人员也能轻松探索数据。在实战中,Tableau用于业务监控、数据storytelling和自助式分析,推动数据民主化,提升决策效率。未来,Tableau将持续创新,扩展生态系统,并保障数据安全与合规性,助力企业最大化数据价值。
456 0
|
7月前
|
监控 数据可视化 安全
Spring Cloud可视化智慧工地大数据云平台源码(人、机、料、法、环五大维度)
智慧工地平台是依托物联网、互联网、AI、可视化建立的大数据管理平台,是一种全新的管理模式,能够实现劳务管理、安全施工、绿色施工的智能化和互联网化。围绕施工现场管理的人、机、料、法、环五大维度,以及施工过程管理的进度、质量、安全三大体系为基础应用,实现全面高效的工程管理需求,满足工地多角色、多视角的有效监管,实现工程建设管理的降本增效,为监管平台提供数据支撑。
133 2
|
7月前
|
机器学习/深度学习 数据可视化 数据挖掘
探索大数据时代的关键技术:数据挖掘、可视化和数据仓库
探索大数据时代的关键技术:数据挖掘、可视化和数据仓库
560 0
|
2月前
|
消息中间件 监控 数据可视化
大数据-79 Kafka 集群模式 集群监控方案 JavaAPI获取集群指标 可视化监控集群方案: jconsole、Kafka Eagle
大数据-79 Kafka 集群模式 集群监控方案 JavaAPI获取集群指标 可视化监控集群方案: jconsole、Kafka Eagle
108 2
|
6月前
|
分布式计算 数据可视化 大数据
于SpringBoot+大数据城市景观画像可视化设计和实现
于SpringBoot+大数据城市景观画像可视化设计和实现
|
2月前
|
存储 分布式计算 资源调度
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(一)
90 5
|
2月前
|
资源调度 数据可视化 大数据
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
大数据-04-Hadoop集群 集群群起 NameNode/DataNode启动 3台公网云 ResourceManager Yarn HDFS 集群启动 UI可视化查看 YarnUI(二)
39 4
|
4月前
|
数据可视化 大数据
【Echarts大屏】大数据平台可视化大屏
【Echarts大屏】大数据平台可视化大屏
【Echarts大屏】大数据平台可视化大屏
|
4月前
|
数据采集 数据可视化 大数据
【优秀python大屏案例】基于python flask的前程无忧大数据岗位分析可视化大屏设计与实现
本文介绍了一个基于Python Flask框架的前程无忧大数据岗位分析可视化大屏系统,该系统通过爬虫技术采集招聘数据,利用机器学习算法进行分析,并以可视化大屏展示,旨在提高招聘市场数据分析的效率和准确性,为企业提供招聘决策支持和求职者职业规划参考。
173 2