数据分析案例-航空公司满意度数据可视化

简介: 数据分析案例-航空公司满意度数据可视化

1.数据集介绍


本数据来源于Kaggle,原始数据共有103904条,共23个特征,具体各变量含义如下:


Gender:乘客性别(女、男)

Customer Type:客户类型(Loyal customer, disloyal customer)

Age:乘客的实际年龄

Type of Travel:乘客的飞行目的(个人旅行、商务旅行)

Class:乘客飞机的旅行等级(商务舱、经济舱、经济舱)

Flight Distance:本次行程的飞行距离

Inflight wifi service:对机上wifi服务的满意度(0:不适用;1-5)

Departure/Arrival time convenient:对出发/到达时间方便的满意度

Ease of Online booking:在线预订的满意度

Gate location:对Gate location的满意度

Food and drink:食物和饮料的满意度

Online boarding:网上寄宿的满意度

Seat comfort:座椅舒适度满意度

Inflight entertainment:机上娱乐满意度

On-board service:船上服务满意度

Leg room service:腿部空间服务满意度

Baggage handling:行李处理满意度

Checkin service:值机服务满意度

Inflight service:机上服务满意度

Cleanliness:清洁度满意度

Departure Delay in Minutes:出发时延迟的分钟数

Arrival Delay in Minutes:到达时延迟的分钟数

Satisfaction:航空公司满意度(满意、中立或不满意)


2.技术工具


Python版本:3.9


代码编辑器:jupyter notebook


3.导入数据


首先导入本次实验用到的第三方库,然后导入航空公司满意度数据


接着删除数据集中的缺失值


4.数据探索性分析


这里我先自定义三个可视化图形的函数,方便后面调用


4.1相关性分析


正相关:商务舱、在线登机和商务旅行是人们满意的主要原因。


负相关:个人旅行和经济舱导致不满意。


4.2性别对满意度的影响


4.3年龄对满意度的影响


看起来分布是相当对称的,大多数人都在40岁左右。也许我们可以说满意的人比不满意的人更大。 满意的人大约在40-56岁之间。不满意的年龄在20-40岁之间。


4.4旅行类型对满意度的影响


个人旅行有很大的影响。大多数个人旅行者都是不满意的人。


4.5座椅等级对满意度的影响


好吧,我们可以注意到经济舱有很多不满意的人…大多数经济舱乘客也不满意。另一方面,商务舱有大多数满意的人。


4.6客户类型对满意度的影响


忠诚客户大多数都是商务舱。不忠诚客户大多数都是经济舱。这里我们可以注意到,大多数个人旅行乘坐的是经济舱。这与个人旅行和经济舱都有很多不满意的人的事实是一致的。另一方面,大多数商务旅行都乘坐商务舱。


4.7飞行距离对满意度的影响


似乎没有影响。大多数旅行都是500单位距离。


4.8航班延迟对满意度的影响


正如预期的那样,出发延误对到达延误有很强的相关性。我们还可以注意到,出发延误近似等于到达延误。它告诉我们知道延误只发生在航班开始前(而不是在飞行过程中)。


大多数人对出发和到达时间的满意度为4级或5级。


4.9其他分析


现在我们来分析一下跟量表有关的变量,也就是说这些变量都是打分制0-5


相关系数热力图

目录
相关文章
|
3月前
|
数据可视化 数据挖掘 Linux
震撼发布!Python数据分析师必学,Matplotlib与Seaborn数据可视化实战全攻略!
在数据科学领域,数据可视化是连接数据与洞察的桥梁,能让复杂的关系变得直观。本文通过实战案例,介绍Python数据分析师必备的Matplotlib与Seaborn两大可视化工具。首先,通过Matplotlib绘制基本折线图;接着,使用Seaborn绘制统计分布图;最后,结合两者在同一图表中展示数据分布与趋势,帮助你提升数据可视化技能,更好地讲述数据故事。
58 1
|
4月前
|
数据采集 存储 数据挖掘
【优秀python数据分析案例】基于Python书旗网小说网站数据采集与分析的设计与实现
本文介绍了一个基于Python的书旗网小说网站数据采集与分析系统,通过自动化爬虫收集小说数据,利用Pandas进行数据处理,并通过Matplotlib和Seaborn等库进行数据可视化,旨在揭示用户喜好和市场趋势,为图书出版行业提供决策支持。
380 6
【优秀python数据分析案例】基于Python书旗网小说网站数据采集与分析的设计与实现
|
3月前
|
机器学习/深度学习 数据可视化 数据挖掘
数据可视化大不同!Python数据分析与机器学习中的Matplotlib、Seaborn应用新视角!
在数据科学与机器学习领域,数据可视化是理解数据和优化模型的关键。Python凭借其强大的可视化库Matplotlib和Seaborn成为首选语言。本文通过分析一份包含房屋面积、卧室数量等特征及售价的数据集,展示了如何使用Matplotlib绘制散点图,揭示房屋面积与售价的正相关关系;并利用Seaborn的pairplot探索多变量间的关系。在机器学习建模阶段,通过随机森林模型展示特征重要性的可视化,帮助优化模型。这两个库在数据分析与建模中展现出广泛的应用价值。
51 2
|
3月前
|
数据可视化 数据挖掘 Python
惊呆了!Python数据分析师如何用Matplotlib、Seaborn秒变数据可视化大师?
在数据驱动时代,分析师们像侦探一样在数字海洋中寻找线索,揭示隐藏的故事。数据可视化则是他们的“魔法棒”,将复杂数据转化为直观图形。本文将带你探索Python数据分析师如何利用Matplotlib与Seaborn这两大神器,成为数据可视化大师。Matplotlib提供基础绘图功能,而Seaborn在此基础上增强了统计图表的绘制能力,两者结合使数据呈现更高效、美观。无论是折线图还是箱形图,这两个库都能助你一臂之力。
48 4
|
3月前
|
数据可视化 数据挖掘 Python
告别枯燥数字,拥抱视觉盛宴!Python 数据分析中的数据可视化艺术,你 get 了吗?
在数据驱动时代,数据分析至关重要,但单纯依赖数据表格难以揭示其背后的洞见。这时,数据可视化便彰显出其重要性,尤其借助 Python 的强大工具如 Matplotlib、Seaborn 和 Plotly 等,可将数据转化为直观的图形。Matplotlib 提供高度定制的图表,Seaborn 则简化了图表美化过程。通过折线图、散点图、箱线图、小提琴图及热力图等多种图表形式,我们可以更深入地理解数据分布与关系,有效传达信息并支持决策制定。数据可视化不仅是一门技术,更是讲述数据故事的艺术。
75 3
|
4月前
|
数据采集 数据可视化 关系型数据库
【优秀python 数据分析案例】基于python的穷游网酒店数据采集与可视化分析的设计与实现
本文介绍了一个基于Python的穷游网酒店数据采集与可视化分析系统,通过爬虫技术自动抓取酒店信息,并利用数据分析算法和可视化工具,提供了全国主要城市酒店的数量、星级、价格、评分等多维度的深入洞察,旨在为旅行者和酒店经营者提供决策支持。
139 4
【优秀python 数据分析案例】基于python的穷游网酒店数据采集与可视化分析的设计与实现
|
4月前
|
数据可视化 数据挖掘 Python
Python中的数据可视化:探索性数据分析的利器
【8月更文挑战第29天】在数据科学的世界里,数据可视化是理解复杂数据集的关键。本文将引导你通过Python的强大库,如Matplotlib和Seaborn,来揭示数据背后的故事。我们将一起探索如何利用这些工具进行有效的数据可视化,从而促进对数据的深入理解和分析。文章不仅提供代码示例,还将讨论如何选择恰当的图表类型、调整视觉元素以及如何解释图表结果,旨在帮助初学者建立坚实的数据可视化基础。
|
4月前
|
JSON 数据挖掘 API
案例 | 用pdpipe搭建pandas数据分析流水线
案例 | 用pdpipe搭建pandas数据分析流水线
|
4月前
|
数据可视化 数据挖掘 API
Python数据分析:数据可视化(Matplotlib、Seaborn)
数据可视化是数据分析中不可或缺的一部分,通过将数据以图形的方式展示出来,可以更直观地理解数据的分布和趋势。在Python中,Matplotlib和Seaborn是两个非常流行和强大的数据可视化库。本文将详细介绍这两个库的使用方法,并附上一个综合详细的例子。
|
4月前
|
数据可视化 数据挖掘 Python
数据可视化不再难!Matplotlib带你轻松绘制精美图表,让数据分析焕发光彩!
【8月更文挑战第22天】今天分享如何用Python的Matplotlib库绘制多样图表。Matplotlib是数据可视化的强大工具,对数据分析至关重要。本文分六部分:首先介绍环境准备,包括安装和配置;随后通过四个案例演示折线图、柱状图、饼图及散点图的绘制方法;最后总结并鼓励大家进一步探索Matplotlib的丰富功能。跟着示例操作,你将学会基本图表的制作,提升数据展示技能。
51 0