【python】Python航空公司客户价值数据分析(代码+论文)【独一无二】

简介: 【python】Python航空公司客户价值数据分析(代码+论文)【独一无二】


👉博__主👈:米码收割机

👉技__能👈:C++/Python语言

👉公众号👈:测试开发自动化【获取源码+商业合作】

👉荣__誉👈:阿里云博客专家博主、51CTO技术博主

👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。



一、项目说明

本文通过对航空公司的客户数据进行多维度的可视化分析,深入探讨了客户的性别比例、年龄段分布、工作省份分布、会员等级、飞行活跃度、折扣率、积分兑换次数等关键指标,以揭示客户群体的特征和趋势。分析结果显示,客户性别比例相对均衡,年龄跨度广泛,不同会员等级客户的年龄和飞行习惯有所差异。工作省份分布、客户飞行活跃度、累计飞行里程与年龄等方面的分析为航空公司提供了有益的市场洞察和战略指导。

尽管分析结果丰富多彩,但仍然存在一些不足之处,例如未考虑到个体差异、满意度、竞争对手等因素的影响。不过,这些可视化分析为航空公司提供了宝贵的数据支持,有助于提高客户关系管理、市场策略制定和服务质量,为业务增长和竞争优势提供了坚实基础。进一步的研究和分析将有助于更全面地理解客户行为和需求,推动航空公司的持续发展和创新。

(论文56页)

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

二、部分代码展示

# 数据读取
df = pd.read_csv('数据.csv', encoding='gbk')
#
bar = (
    Bar()
    .add_xaxis(df['MEMBER_NO'].tolist())
    .add_yaxis("飞行次数", df['FLIGHT_COUNT'].tolist())
    .set_global_opts(title_opts=opts.TitleOpts(title="客户飞行次数分析"))
)
# 保存为 HTML 文件
bar.render('flight_count_analysis.html')
# 客户性别比例分析:
# 计算性别比例
gender_counts = df['GENDER'].value_counts()
# 创建饼图
pie = (
    Pie()
    .add("", [list(z) for z in zip(gender_counts.index.tolist(), gender_counts.tolist())])
    .set_global_opts(title_opts=opts.TitleOpts(title="客户性别比例分析"))
    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c} ({d}%)"))
)
# 保存为 HTML 文件
pie.render('gender_ratio_analysis.html')
# 客户年龄段分析:
# 将年龄分组(20-30, 30-40, 40-50, ...)
bins = [20, 30, 40, 50, 60, 70, 80]
labels = ['20-30', '30-40', '40-50', '50-60', '60-70', '70-80']
df['age_group'] = pd.cut(df['AGE'], bins=bins, labels=labels, right=False)
# 统计每个年龄段的客户数量
age_group_counts = df['age_group'].value_counts().sort_index()
# 创建柱状图
bar = (
    Bar()
    .add_xaxis(age_group_counts.index.tolist())
    .add_yaxis("客户数量", age_group_counts.tolist())
    .set_global_opts(title_opts=opts.TitleOpts(title="客户年龄段分析"))
)
# 保存为 HTML 文件
bar.render('age_group_analysis.html')
# 工作省份分析:
# 统计每个省份的客户数量
province_counts = df['WORK_PROVINCE'].value_counts()
# 创建地理图表
map_ = (
    Map()
    .add("客户数量", [list(z) for z in zip(province_counts.index.tolist(), province_counts.tolist())], "china")
    .set_global_opts(
        title_opts=opts.TitleOpts(title="工作省份客户分布"),
        visualmap_opts=opts.VisualMapOpts(max_=province_counts.max()),
    )
)
# 保存为 HTML 文件
略.....

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

文件展示:

三、数据分析可视化

3.1 客户飞行次数分析

这份分析从一份名为’数据.csv’的数据集中读取了客户信息和飞行次数的数据,并通过柱状图展示了客户飞行次数的分析结果。柱状图是一种适合显示离散数据分布的图表类型,其中X轴表示客户的会员号码(MEMBER_NO),而Y轴表示飞行次数。每个垂直柱子的高度代表了相应会员的飞行次数。

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.2 客户性别比例的可视化分析

  1. 性别分布:根据饼图显示,客户性别分为两类,分别是男性(“男”)和女性(“女”)。在特定数据集中,男性客户占据了绝大多数,而女性客户相对较少。
  2. 性别比例:饼图清晰地展示了不同性别客户的比例关系。男性客户占比较大的部分,而女性客户占比较小。通过饼图上的标签,还可以看到每个性别群体的具体占比百分比。

3. 性别分布的重要性:性别比例分析对于制定定向营销策略和客户细分非常重要。在了解客户性别分布后,航空公司可以根据不同性别的客户特点和需求来制定更具针对性的市场活动,以提高客户满意度和忠诚度。

4. 数据分析工具:通过饼图的分析,展示了数据分析师或数据科学家如何使用Python中的Pyecharts库来进行可视化分析,以便更好地理解客户数据。

总之,性别比例的饼图可视化分析为航空公司提供了客户性别分布的清晰概览,为制定相关策略和决策提供了有用的信息。

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.3 客户年龄段的可视化分析

年龄段划分:根据代码中的分组规则,客户年龄被划分成了六个不同的年龄段,分别是20-30岁、30-40岁、40-50岁、50-60岁、60-70岁和70-80岁。这种分组有助于更好地理解不同年龄段客户的特征和行为。

年龄段分布:柱状图清晰地展示了每个年龄段的客户数量。从图中可以看出,年龄段在客户分布中的分布情况,以及哪些年龄段的客户数量相对较多。

3. 年龄段分布的重要性:年龄段分析对于航空公司的市场定位和客户细分非常重要。不同年龄段的客户可能具有不同的需求和偏好,因此了解客户年龄分布有助于制定更有针对性的营销策略和产品定制。

3.4 工作省份客户分布的可视化分析

  1. 工作省份分布:地理图表清晰地展示了不同省份的客户数量分布,中国地图上的各个省份被不同颜色的区块表示,颜色深浅反映了客户数量的多少。
  2. 客户数量差异:根据图表可以看出,一些省份拥有较多的客户,而其他省份的客户数量相对较少。客户数量的差异可能受多种因素影响,如经济发展水平、人口密度等。

3.5 客户年龄与累计飞行里程之间关系的可视化分析

  1. 散点图趋势:从图表可以看出,年龄与累计飞行里程之间存在一定的趋势。随着年龄的增长,部分客户的累计飞行里程也有所增加,但并不是所有客户都遵循相同的趋势。
  2. 分布差异:散点图展示了客户年龄和累计飞行里程的分布情况,可以看出年龄在不同范围内的客户有不同的累计飞行里程分布。一些年轻客户可能已经累积了较多的飞行里程,而一些年长客户可能累积较少。

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

  1. 数据关联性:散点图的分析有助于了解客户年龄和累计飞行里程之间的关联性。这对于航空公司可以更好地了解不同年龄段客户的旅行习惯和需求,从而优化市场策略和客户服务。
  2. 数据可视化工具:通过散点图的分析,展示了如何使用Python中的Pyecharts库创建散点图,帮助数据分析师或数据科学家更好地呈现和解释数据。

3.6 不同会员等级的平均年龄分析,

  1. 平均年龄差异:根据环形图可以看出,不同会员等级的平均年龄存在差异。一般来说,高级会员等级的客户平均年龄相对较大,而低级会员等级的客户平均年龄相对较小。
  2. 会员等级分布:环形图展示了各个会员等级的平均年龄,通过不同颜色的环形区块表示不同的会员等级。这有助于航空公司了解不同会员等级客户的年龄特征。

  3. 数据可视化工具:通过环形图的分析,展示了如何使用Python中的Pyecharts库创建环形图,以清晰可视化方式呈现不同会员等级的平均年龄数据。
  4. 业务决策:可视化分析可以帮助航空公司更好地了解其不同会员等级客户的年龄分布情况,有助于针对不同年龄段的客户制定更有针对性的市场策略和服务方案。

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.7 客户飞行次数和总飞行公里数的关系分析

  1. 正相关关系:从散点图可以观察到,客户的飞行次数和总飞行公里数之间存在正相关关系。即随着飞行次数的增加,总飞行公里数也增加。
  2. 飞行活跃度:散点图反映了客户的飞行活跃度,更高的飞行次数通常对应着更大的总飞行公里数。这可以帮助航空公司了解客户的飞行行为和忠诚度。

4.业务决策:对于航空公司来说,理解客户飞行次数和总飞行公里数之间的关系可以有助于制定更精确的市场策略,例如奖励计划或促销活动,以鼓励客户提高飞行活跃度。

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.8 不同会员等级在平均飞行次数、平均飞行里程和平均折扣率等关键指标上的综合表现分析

2.高级会员表现:从雷达图可以看出,高级会员等级(FFP_TIER较高)通常在平均飞行次数和平均飞行里程上表现更好,曲线更接近雷达图的最大值。这意味着高级会员通常有更多的飞行次数和飞行里程。

3. 折扣率比较:雷达图还显示了不同会员等级在平均折扣率上的表现。较低的会员等级可能具有更高的平均折扣率,这可能是为了吸引更多的客户。

4. 数据可视化工具:通过分析,展示了如何使用Python中的Pyecharts库创建雷达图,以便比较不同会员等级在多个指标上的表现。

业务洞察:对于航空公司来说,这种分析可以帮助他们了解不同会员等级的特点和需求,有助于制定针对性的服务和促销策略,以提高客户忠诚度和盈利能力。

综上所述,雷达图分析提供了不同会员等级在关键指标上的综合表现信息,为航空公司提供了有用的业务见解,可用于优化客户管理和市场战略。

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.9 统计每个省份的客户数量和累计飞行里程总和

进行了根据工作省份对客户进行分组,统计每个省份的客户数量和累计飞行里程总和,并使用树形图展示了每个省份的客户数量和累计飞行里程。

  1. 客户分布情况:树形图以不同的省份为节点,展示了每个省份的客户数量。节点的大小表示客户数量,较大的节点代表客户数量较多的省份。

3.10 首次和最后一次飞行时间的分析

  1. 时间分布趋势:通过柱状图和折线图的组合,展示了首次和最后一次飞行的客户数量随时间的分布趋势。柱状图表示每个月的首次飞行客户数量,而折线图表示每个月的最后一次飞行客户数量。这两个图表有助于了解客户在不同时间段内的飞行行为。
  2. 首次飞行客户数量:柱状图显示了每个月首次飞行的客户数量。根据柱状图的趋势,可以看出不同月份首次飞行客户数量的波动情况。这有助于航空公司识别哪些月份可能是吸引新客户的最佳时机。

3.11 工作省份客户分布词云图:

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.12 会员等级与平均累计飞行里程漏斗图

3.13 客户的平均积分兑换次数分析

3.14 液体填充图来展示了达到最高会员等级的客户比例

3.15 最高会员等级的客户在总客户中所占的比例

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇

3.16 客户价值评估模型

👇👇👇 关注公众号,回复 “航空数据分析” 获取源码👇👇👇


相关文章
|
15天前
|
机器学习/深度学习 数据采集 数据可视化
Python数据分析入门涉及基础如Python语言、数据分析概念及优势。
【7月更文挑战第5天】Python数据分析入门涉及基础如Python语言、数据分析概念及优势。关键工具包括NumPy(数组操作)、Pandas(数据处理)、Matplotlib(绘图)、Seaborn(高级可视化)和Scikit-learn(机器学习)。流程涵盖数据获取、清洗、探索、建模、评估和展示。学习和实践这些将助你有效利用数据。
|
1天前
|
数据采集 机器学习/深度学习 数据挖掘
转换数据,扭转乾坤!Python转换技巧,让你的数据分析如虎添翼!
【7月更文挑战第19天】Python在数据转换中扮演关键角色,借助Pandas库进行数据清洗,如填充缺失值、处理异常值和转换数据类型。数据重塑通过pivot、melt和groupby提供多维度视图。文本数据通过独热编码或标签编码转化为数值。自定义函数解决复杂转换问题,提升数据分析的深度和准确性。掌握这些技巧,能有效挖掘数据价值,助力决策。
16 4
|
11天前
|
机器学习/深度学习 监控 算法
Python数据分析与机器学习在金融风控中的应用
Python数据分析与机器学习在金融风控中的应用
39 12
|
8天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
【7月更文挑战第12天】Python的Pandas和NumPy库助力高效数据处理。Pandas用于数据清洗,如填充缺失值和转换类型;NumPy则擅长数组运算,如元素级加法和矩阵乘法。结合两者,可做复杂数据分析和特征工程,如产品平均销售额计算及销售额标准化。Pandas的时间序列功能,如移动平均计算,进一步增强分析能力。掌握这两者高级技巧,能提升数据分析质量和效率。
21 4
|
9天前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
微软在 UserVoice 上运营着⼀个反馈论坛,每个⼈都可以在这⾥提交新点⼦供他⼈投票。票数最⾼的功能请求是“将 Python 作为Excel 的⼀门脚本语⾔”,其得票数差不多是第⼆名的两倍。尽管⾃2015 年这个点⼦发布以来并没有什么实质性进展,但在 2020 年年末,Python 之⽗ Guido van Rossum 发布推⽂称“退休太无聊了”,他将会加入微软。此事令 Excel ⽤户重燃希望。我不知道他的举动是否影响了 Excel 和 Python 的集成,但我清楚的是,为何⼈们迫切需要结合 Excel 和 Python 的⼒量,⽽你⼜应当如何从今天开始将两者结合起来。总之,这就是本
|
11天前
|
数据采集 机器学习/深度学习 数据挖掘
Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战
Python基于波动率模型(ARCH和GARCH)进行股票数据分析项目实战
|
12天前
|
机器学习/深度学习 数据采集 搜索推荐
Python数据分析与机器学习在电子商务推荐系统中的应用
Python数据分析与机器学习在电子商务推荐系统中的应用
33 5
|
12天前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
微软在 UserVoice 上运营着⼀个反馈论坛,每个⼈都可以在这⾥提交新点⼦供他⼈投票。票数最⾼的功能请求是“将 Python 作为Excel 的⼀门脚本语⾔”,其得票数差不多是第⼆名的两倍。尽管⾃2015 年这个点⼦发布以来并没有什么实质性进展,但在 2020 年年末,Python 之⽗ Guido van Rossum 发布推⽂称“退休太无聊了”,他将会加入微软。此事令 Excel ⽤户重燃希望。我不知道他的举动是否影响了 Excel 和 Python 的集成,但我清楚的是,为何⼈们迫切需要结合 Excel 和 Python 的⼒量,⽽你⼜应当如何从今天开始将两者结合起来。总之,这就是本
|
12天前
|
数据挖掘 Python
利用Python进行数据分析PDF下载经典数据分享推荐
**Python数据分析大师作,Wes McKinney亲著,详述数据操作、清洗与分析。第2版面向Python 3.6,涵盖pandas、NumPy、IPython和Jupyter更新,实战案例丰富;第3版已升级至Python 3.10和pandas 1.4,继续引领数据科学潮流。[PDF下载](https://zhangfeidezhu.com/?p=337)**
19 0
利用Python进行数据分析PDF下载经典数据分享推荐
|
15天前
|
数据采集 机器学习/深度学习 数据可视化
了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。
【7月更文挑战第5天】了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。数据预处理涉及缺失值(dropna(), fillna())和异常值处理。使用describe()进行统计分析,通过Matplotlib和Seaborn绘图。回归和分类分析用到Scikit-learn,如LinearRegression和RandomForestClassifier。
31 3