ChatGPT在数据可视化中的应用(一)

简介: ChatGPT在数据可视化中的应用(一)

ChatGPT在数据可视化中的应用
在数据分析中,数据可视化是必不可少的一部分,但是目前ChatGPT无法根据我们的诉求直接生成图表结果。尽管如此,它可以在数据可视化的其他方面发挥一些作用,如下所示。

(1)选择合适的图表类型:ChatGPT可以根据我们提供的数据和希望图表达到的效果,推荐合适的图表类型。例如,对于时间序列数据,ChatGPT可能会推荐使用折线图;而对于类别数据,ChatGPT可能会推荐使用柱状图或饼图。

(2)提供可视化建议:ChatGPT可以根据我们所提供数据集的特点和图表的使用场景等,给出一些可视化方面的建议,如选择合适的颜色、图例、标签等。

(3)指导生成图表:ChatGPT可以根据收到的数据和需求,指导我们如何使用不同软件实现想要的效果。

(4)解读图表:ChatGPT可以根据我们提供的图表数据,分析其中的关键信息,如趋势、异常值、关系等,并将这些信息以文字形式呈现出来。这可以帮助受众更好地理解图表,为决策提供有力支持。

(5)故事化呈现:ChatGPT可以将数据可视化等结果和分析结合起来,以故事的形式将数据和结论串联在一起,帮助用户更好地理解和记住数据分析结果。

1.1 选择合适的图表类型
我们可以问ChatGPT在数据可视化中常用的图表类型有哪些,不同图表的使用场景各是什么,应该根据什么原则选取合适的图表类型。将这些问题发送给ChatGPT,会得到如下结果。

【常用的数据可视化图表类型及其使用场景:

  • 折线图(Line Chart):
    使用场景: 用于显示随时间或连续变量变化的趋势,比较不同组在不同时间的数据。
  • 柱状图(Bar Chart):
    使用场景: 用于比较不同类别之间的数据差异,展示离散数据。
  • 饼图(Pie Chart):
    使用场景: 用于显示部分与整体的关系,强调各部分占比。
  • 散点图(Scatter Plot):
    使用场景: 用于显示两个变量之间的关系,帮助发现变量之间的相关性或异常值。
  • 直方图(Histogram):
    使用场景: 用于显示数据的分布情况,特别适用于展示连续变量的频率分布。
  • 箱线图(Box Plot):
    使用场景: 用于显示数据的中位数、四分位数和异常值,帮助了解数据的分布形状和离群值情况。
  • 热力图(Heatmap):
    使用场景: 用于呈现数据密度,特别适用于大型数据集的可视化和相关性分析。

选择合适的图表类型原则:

  • 数据类型: 根据数据的类型(离散、连续、分类等)选择对应的图表类型。
  • 目标: 确定你想要传达的信息和目的,选择最能有效展示这些信息的图表类型。
  • 数据关系: 考虑数据之间的关系,如趋势、比较、分布等,选择最能体现关系的图表类型。
  • 受众: 考虑观众的背景知识和接受能力,选择易于理解并传达信息的图表类型。
  • 美学: 选择符合美学审美和清晰易读的图表类型,避免造成视觉混乱。

根据以上原则,在具体场景下选择合适的数据可视化图表类型将有助于有效传达信息并提高数据解读的效果。如果需要更具体的指导或有其他问题。】

ChatGPT给出的信息比较全面:首先介绍了常用的图表类型及其主要用途和使用场景;其次说明了图表选择的原则。

我们还可以直接利用ChatGPT选择合适的图表类型,只需把数据结构和我们希望通过图表传达的信息描述清楚,ChatGPT就会推荐合适的图表类型。

接下来看一个具体案例。发送如下内容给ChatGPT。
image.png

ChatGPT收到上述内容后,返回如下结果。

【针对描述各月销量趋势的数据,您可以选择使用折线图(Line Chart)来展示。折线图适合显示随时间变化的趋势,能够清晰地呈现每个月的销量变化情况,帮助观察者直观地了解销售趋势的起伏和发展。

通过在横轴上标记月份,纵轴上标记销量,您可以将过去12个月的销售数据以连续的折线方式呈现,以便于观察每个月的销量变化情况。这种图表类型不仅能够展示整体销售趋势,还能帮助您识别季节性变化、高峰期或低谷期等信息,为制定未来销售策略提供重要参考。

因此,根据您的情况下,推荐使用折线图来描绘各月销量的趋势。】

ChatGPT的回答没有问题。接下来我们问一个稍微难一点的问题。

image.png

ChatGPT收到上述内容后,返回如下结果。

【针对您描述的需求,为展示不同功能页面的用户停留时长在整体时长中的占比变化趋势,您可以选择使用堆叠面积图(Stacked Area Chart)来进行数据可视化。堆叠面积图能够清晰地显示多个部分在整体中的比例关系随时间的变化情况,同时也能展示各功能页面的相对大小和比例变化。

通过将不同功能页面的停留时长数据以堆叠方式呈现在同一张图表上,您可以直观地了解每个功能页面的停留时长在整体时长中所占比例的变化趋势。这种图表类型有助于比较各功能页面之间的影响力和用户偏好,帮助您识别哪些功能页面对整体用户留存起到关键作用。

因此,建议您使用堆叠面积图来展示不同功能页面的用户停留时长在整体时长中的占比变化趋势。】

对于这个案例,ChatGPT的回答也没有问题。

1.2 提供可视化建议
也可以直接告诉ChatGPT我们想对某些数据进行可视化,它会给出相应的建议。比如发送如下内容给ChatGPT。
image.png

ChatGPT收到上述内容后,返回如下结果。

针对公司各部门第一季度的销售业绩数据,你可以创建一个清晰易懂的柱状图,并添加数据标签、标题和图例以增强可视化效果。以下是一般步骤和建议:

  • 数据可视化建议:
  • 柱状图设计:
    横轴(X轴): 部门名称(市场部、产品部、技术部、运营部)
    纵轴(Y轴): 销售业绩(万元)
  • 添加数据标签:
    在每个柱子上显示销售业绩数值,直观展示各部门的具体销售额。
  • 标题:
    添加描述性标题,如“公司各部门第一季度销售业绩比较”。
  • 图例:
    添加图例,说明不同颜色的柱子代表的部门名称,使观众能够快速了解每个部门的对应关系。
  • 风格和配色:
    使用清晰的配色方案,确保柱状图易于阅读和理解。
    可使用公司品牌色或经典的颜色组合来突出图表。

示例代码:

import matplotlib.pyplot as plt
import matplotlib
matplotlib.rc("font",family='Yuanti SC')  # 解决不能显示中文字体
departments = ['市场部', '产品部', '技术部', '运营部']
sales_data = [125, 105, 83, 72]

plt.bar(departments, sales_data, color='skyblue')
plt.xlabel('部门')
plt.ylabel('销售业绩(万元)')
plt.title('公司各部门第一季度销售业绩')
for i in range(len(sales_data)):
    plt.text(i, sales_data[i] + 2, str(sales_data[i]), ha='center')

plt.legend(['销售业绩'])
plt.show()

通过以上可视化建议和示例代码,你可以创建一幅清晰明了的柱状图来展示公司各部门第一季度的销售业绩,同时增加数据标签、标题和图例,帮助观众更好地理解数据。如下图:
image.png

接下文 ChatGPT在数据可视化中的应用(二)https://developer.aliyun.com/article/1620327

相关文章
|
24天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
16天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
20天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2577 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
18天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
3天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
2天前
|
存储 人工智能 搜索推荐
数据治理,是时候打破刻板印象了
瓴羊智能数据建设与治理产品Datapin全面升级,可演进扩展的数据架构体系为企业数据治理预留发展空间,推出敏捷版用以解决企业数据量不大但需构建数据的场景问题,基于大模型打造的DataAgent更是为企业用好数据资产提供了便利。
163 2
|
20天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1576 16
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
22天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
977 14
|
4天前
|
Linux 虚拟化 开发者
一键将CentOs的yum源更换为国内阿里yum源
一键将CentOs的yum源更换为国内阿里yum源
221 2
|
17天前
|
人工智能 开发框架 Java
重磅发布!AI 驱动的 Java 开发框架:Spring AI Alibaba
随着生成式 AI 的快速发展,基于 AI 开发框架构建 AI 应用的诉求迅速增长,涌现出了包括 LangChain、LlamaIndex 等开发框架,但大部分框架只提供了 Python 语言的实现。但这些开发框架对于国内习惯了 Spring 开发范式的 Java 开发者而言,并非十分友好和丝滑。因此,我们基于 Spring AI 发布并快速演进 Spring AI Alibaba,通过提供一种方便的 API 抽象,帮助 Java 开发者简化 AI 应用的开发。同时,提供了完整的开源配套,包括可观测、网关、消息队列、配置中心等。
734 9