【python】python知名品牌调查问卷数据分析可视化(源码+调查数据表)【独一无二】

简介: 【python】python知名品牌调查问卷数据分析可视化(源码+调查数据表)【独一无二】

一、设计要求

描述性统计分析

对数据进行基本的描述性统计分析,包括以下内容:

  • 年龄分布:计算各年龄段的人数和百分比,并统计年龄的均值、中位数和标准差。
  • 性别分布:计算不同性别的人数和百分比。
  • 职业分布:计算不同职业的人数和百分比。.
推论性统计分析

进行推论性统计分析,提供以下功能:

  • t检验:比较不同性别在问卷总分上的差异,输出t统计量和p值。
  • 卡方检验:比较不同年龄段在职业分布上的差异,输出卡方值和p值。
数据可视化

使用Matplotlib进行数据可视化,提供以下图表:

  • 年龄分布图:以柱状图形式展示各年龄段的频次。
  • 性别分布图:以柱状图形式展示不同性别的频次。
  • 职业分布图:以柱状图形式展示不同职业的频次。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈


二、设计思路

代码设计思路分析

1. 文件导入与字体设置
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from matplotlib import font_manager

# 设置中文字体
font_path = 'SimHei.ttf'  # 根据实际路径设置字体路径
font = font_manager.FontProperties(fname=font_path)
plt.rcParams['font.family'] = font.get_name()

导入所需的库,设置中文字体路径以确保在可视化过程中中文标签能够正确显示。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

2. 读取数据
file_path = '264356010_按文本_关于卡尔美运动品牌知名度的问卷调查_47_47.xlsx'
data = pd.read_excel(file_path, engine='openpyxl')

从指定的Excel文件中读取问卷调查数据,使用openpyxl引擎以兼容不同格式的Excel文件。

3. 数据预处理
age_mapping = {
    'A. 18岁及以下': 18,
    'B. 19-25岁': 22,
    'C. 26-35岁': 30,
    'D. 35岁及以上': 40
}
data['年龄数值'] = data['1、请问您的年龄是?'].map(age_mapping)

将年龄选项转换为数值形式,便于后续的统计分析。通过map方法将年龄区间映射为对应的数值。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

4. 描述性统计分析
# 年龄分布
# 略.....
# 略.....
# 略.....

# 性别分布
# 略.....

# 职业分布
# 略.....

# 打印描述性统计结果
print('年龄分布:')
print(pd.DataFrame({'Counts': age_counts, 'Percentage': age_percentage}))
print(f'年龄均值: {age_mean:.2f}')
print(f'年龄中位数: {age_median:.2f}')
print(f'年龄标准差: {age_std:.2f}')

print('\n性别分布:')
print(pd.DataFrame({'Counts': gender_counts, 'Percentage': gender_percentage}))

print('\n职业分布:')
print(pd.DataFrame({'Counts': occupation_counts, 'Percentage': occupation_percentage}))

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

进行描述性统计分析,计算各个类别(年龄、性别、职业)的频次和百分比,并计算年龄的均值、中位数和标准差。输出描述性统计结果,帮助了解数据的基本情况和分布特征。


👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈


5. 推论性统计分析
# t检验 - 比较不同性别的总分
male_scores = data.loc[data['2、您的性别是?'] == 'A. 男', '总分']
# 略.....
# 略.....
print(f'\nt检验结果: t_stat = {t_stat:.4f}, p_val = {p_val:.4f}')


# 卡方检验 - 比较不同年龄段的职业分布
age_groups = pd.cut(data['年龄数值'], bins=[0, 18, 25, 35, 50, 100], labels=['0-18', '19-25', '26-35', '36-50', '50+'])
# 略.....
# 略.....
# 略.....
print(f'\n卡方检验结果: chi2 = {chi2:.4f}, p_val = {p:.4f}')

进行推论性统计分析,包括t检验和卡方检验。t检验用于比较不同性别在总分上的差异,卡方检验用于比较不同年龄段在职业分布上的差异,输出统计检验结果,包括t统计量、p值和卡方值。



👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

————————————————


三、可视化分析

1. 年龄分布图

年龄分布图以柱状图的形式展示了调查问卷中各个年龄段的受访者人数。这一图表可以直观地反映出调查对象的年龄构成,从中我们可以看到不同年龄段受访者的比例。例如,如果18岁及以下和19-25岁年龄段的柱子明显高于其他年龄段,说明该调查问卷的主要受众是年轻人。这对于市场研究人员来说非常重要,因为了解目标人群的年龄分布可以帮助他们制定更有针对性的营销策略和产品定位。此外,通过观察柱状图中的峰值和低谷,我们还可以识别出调查对象的年龄集中区间和相对较少的年龄段,为后续的分析提供数据支持。

# 年龄分布
plt.figure(figsize=(10, 6))
age_counts.plot(kind='bar')
plt.title('年龄分布', fontproperties=font)
plt.xlabel('年龄', fontproperties=font)
plt.ylabel('人数', fontproperties=font)
plt.show()

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

2. 性别分布图

性别分布图也是以柱状图的形式展示,反映了调查问卷中男性和女性受访者的比例。通过这个图表,可以清晰地看到调查样本中不同性别的分布情况。例如,如果男性和女性受访者的柱子高度相近,说明该调查在性别上具有较好的平衡性;而如果某一性别的柱子显著高于另一性别,说明调查在性别分布上存在一定的偏向。性别分布对于市场研究和产品开发同样重要,因为不同性别的消费者可能有不同的需求和偏好。了解性别分布可以帮助企业在推广产品时进行性别细分,从而提高营销效果和用户满意度。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

3. 职业分布图

职业分布图以柱状图的形式展示了受访者的职业构成。这一图表可以帮助我们了解不同职业背景的受访者在调查中的比例。例如,如果图表中显示学生、白领和自由职业者的柱子较高,说明这些职业群体是调查的主要对象。职业分布信息对于了解目标人群的职业背景和经济能力具有重要意义,可以帮助企业更好地理解消费者的购买力和消费习惯。例如,学生群体可能更关注性价比和品牌形象,而白领群体则可能对产品质量和售后服务有更高的要求。通过分析职业分布图,企业可以制定更有针对性的产品开发和市场推广策略,满足不同职业群体的需求。



👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “ 调查问卷 ” 获取。👈👈👈

相关文章
|
19天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
50 0
|
13天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
31 2
|
20天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
31 2
|
11天前
|
并行计算 数据挖掘 大数据
Python数据分析实战:利用Pandas处理大数据集
Python数据分析实战:利用Pandas处理大数据集
|
11天前
|
数据采集 数据可视化 数据挖掘
利用Python进行数据分析:Pandas库实战指南
利用Python进行数据分析:Pandas库实战指南
|
13天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第33天】本文将介绍如何使用Python编程语言进行数据分析和可视化。我们将从数据清洗开始,然后进行数据探索性分析,最后使用matplotlib和seaborn库进行数据可视化。通过阅读本文,你将学会如何运用Python进行数据处理和可视化展示。
|
3月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
80 2
|
3月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
182 4
|
3月前
|
机器学习/深度学习 算法 数据挖掘
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
本文介绍了2023年第二届钉钉杯大学生大数据挑战赛初赛A题的Python代码分析,涉及智能手机用户监测数据分析中的聚类分析和APP使用情况的分类与回归问题。
86 0
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
|
13天前
|
SQL 数据挖掘 Python
数据分析编程:SQL,Python or SPL?
数据分析编程用什么,SQL、python or SPL?话不多说,直接上代码,对比明显,明眼人一看就明了:本案例涵盖五个数据分析任务:1) 计算用户会话次数;2) 球员连续得分分析;3) 连续三天活跃用户数统计;4) 新用户次日留存率计算;5) 股价涨跌幅分析。每个任务基于相应数据表进行处理和计算。