关于睡眠健康数据集的探索

简介: 关于睡眠健康数据集的探索

一、项目描述


1.背景描述


本数据集涵盖了与睡眠和日常习惯有关的诸多变量。如性别、年龄、职业、睡眠时间、睡眠质量、身体活动水平、压力水平、BMI类别、血压、心率、每日步数、以及是否有睡眠障碍等细节。


2.数据说明


解释说明:睡眠障碍

类型 说明
没有表现出任何特定的睡眠障碍。
失眠 有入睡或保持睡眠的困难,导致睡眠不足或质量差
睡眠呼吸暂停 在睡眠过程中出现呼吸暂停,导致睡眠模式紊乱和潜在的健康风险


3.数据来源


www.kaggle.com/datasets/uo…


4.问题描述


全面的睡眠指标:探索睡眠时间、质量和影响睡眠模式的因素。

生活方式因素:分析身体活动水平、压力水平和BMI类别。

心血管健康:检查血压和心率测量。

睡眠障碍分析:识别睡眠障碍的发生,如失眠和睡眠呼吸暂停。


二、数据分析


1.数据读取


import pandas as pd
# encoding要设置,moren utf-8打不开
data=pd.read_csv('Sleep_health_and_lifestyle_dataset.csv',encoding='gb2312')
data.head()

.dataframe tbody tr th:only-of-type {         vertical-align: middle;     } .dataframe tbody tr th {     vertical-align: top; } .dataframe thead th {     text-align: right; }

ID 性别 年龄 职业 睡眠时长 睡眠质量 身体活动水平 压力水平 BMI 血压 心率 每日步数 睡眠障碍
0 1 男性 27 软件工程师 6.1 6 42 6 超重 126/83 77 4200
1 2 男性 28 医生 6.2 6 60 8 正常 125/80 75 10000
2 3 男性 28 医生 6.2 6 60 8 正常 125/80 75 10000
3 4 男性 28 销售代表 5.9 4 30 8 肥胖 140/90 85 3000 睡眠呼吸暂停
4 5 男性 28 销售代表 5.9 4 30 8 肥胖 140/90 85 3000 睡眠呼吸暂停


2.值范围分析


data.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 374 entries, 0 to 373
Data columns (total 13 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   ID      374 non-null    int64  
 1   性别      374 non-null    object 
 2   年龄      374 non-null    int64  
 3   职业      374 non-null    object 
 4   睡眠时长    374 non-null    float64
 5   睡眠质量    374 non-null    int64  
 6   身体活动水平  374 non-null    int64  
 7   压力水平    374 non-null    int64  
 8   BMI     374 non-null    object 
 9   血压      374 non-null    object 
 10  心率      374 non-null    int64  
 11  每日步数    374 non-null    int64  
 12  睡眠障碍    374 non-null    object 
dtypes: float64(1), int64(7), object(5)
memory usage: 38.1+ KB

分析可见无空值


3.值范围分析


data['BMI'].unique()
array(['超重', '正常', '肥胖'], dtype=object)
data['睡眠障碍'].unique()
array(['无', '睡眠呼吸暂停', '失眠'], dtype=object)
data['职业'].unique()
array(['软件工程师', '医生', '销售代表', '老师', '护士', '工程师', '会计师', '科学家', '律师',       '营业员', '主管'], dtype=object)
data['性别'].unique()
array(['男性', '女性'], dtype=object)
data['血压'].unique()
array(['126/83', '125/80', '140/90', '120/80', '132/87', '130/86',       '117/76', '118/76', '128/85', '131/86', '128/84', '115/75',       '135/88', '129/84', '130/85', '115/78', '119/77', '121/79',       '125/82', '135/90', '122/80', '142/92', '140/95', '139/91',       '118/75'], dtype=object)


4.血压处理


data = pd.concat([data,data['血压'].str.split('/',expand = True)],axis = 1)
data.rename({0:'收缩压',1:'舒张压'},inplace=True,axis=1) 
data['收缩压']=data['收缩压'].astype('float32')
data['舒张压']=data['舒张压'].astype('float32')
data.drop('血压', axis=1)
data.head()

.dataframe tbody tr th:only-of-type {         vertical-align: middle;     } .dataframe tbody tr th {     vertical-align: top; } .dataframe thead th {     text-align: right; }

ID 性别 年龄 职业 睡眠时长 睡眠质量 身体活动水平 压力水平 BMI 血压 心率 每日步数 睡眠障碍 收缩压 舒张压
0 1 男性 27 软件工程师 6.1 6 42 6 超重 126/83 77 4200 126.0 83.0
1 2 男性 28 医生 6.2 6 60 8 正常 125/80 75 10000 125.0 80.0
2 3 男性 28 医生 6.2 6 60 8 正常 125/80 75 10000 125.0 80.0
3 4 男性 28 销售代表 5.9 4 30 8 肥胖 140/90 85 3000 睡眠呼吸暂停 140.0 90.0
4 5 男性 28 销售代表 5.9 4 30 8 肥胖 140/90 85 3000 睡眠呼吸暂停 140.0 90.0


5.热力图


import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline 
plt.figure(figsize=(10,6))
sns.heatmap(data.drop('ID',axis=1).corr(),annot=True,fmt="1.1f");

1696837816531.jpg

目录
相关文章
|
数据挖掘 数据库
睡眠健康数据分析(上)
睡眠健康数据分析
738 0
Jupyter-notebook 常用快捷键
Jupyter-notebook 常用快捷键
666 0
|
4月前
|
人工智能 JavaScript 安全
设计稿一键变代码,VTJ.PRO 让想象与实现再无距离。
VTJ.PRO联合MasterGo推出智能设计识别引擎,助力设计师高效生成Vue组件代码,打通设计与开发协作壁垒,提升团队效率。限时领取百万AI额度,开启智能开发新时代!
123 1
|
存储 JavaScript 前端开发
Vue 和 HTML FormData配合axios或ajax上传文件,提交表单数据
Vue 和 HTML FormData配合axios或ajax上传文件,提交表单数据
788 0
|
自然语言处理 编译器 Linux
【Latex】texstudio使用和ACL论文模板初步解读
LaTeX是一类用于编辑和排版的软件,用于生成PDF文档。 LaTeX编辑和排版的核心思想在于,通过\section和\paragraph等语句,规定了每一句话在文章中所从属的层次,从而极大方便了对各个层次批量处理。 LaTeX在使用体验方
2166 0
【Latex】texstudio使用和ACL论文模板初步解读
|
机器学习/深度学习 数据可视化 搜索推荐
使用Python实现深度学习模型:智能睡眠监测与分析
使用Python实现深度学习模型:智能睡眠监测与分析
1401 2
|
Linux 测试技术 网络安全
【好玩的开源项目】Linux系统之部署吃豆人经典小游戏
【7月更文挑战第18天】Linux系统之部署吃豆人经典小游戏
252 3
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战
【机器学习】GLM4-9B-Chat大模型/GLM-4V-9B多模态大模型概述、原理及推理实战
1501 0
|
监控 安全 数据库连接
【Go语言专栏】Go语言中的数据库连接池管理
【4月更文挑战第30天】本文探讨了Go语言中数据库连接池的概念、实现和最佳实践。连接池预先创建并维护数据库连接,减少建立和关闭连接的开销,提高效率和应用稳定性。文中提供了一个简单的连接池实现示例,并列出使用连接池的最佳实践,包括合理设置连接池大小、控制连接生命周期及错误处理等。Go语言的并发机制如协程和通道有助于实现线程安全的连接池。通过实际案例分析,文章旨在帮助开发者更好地理解和应用连接池技术。
431 0
|
JSON 小程序 API
【微信小程序】-- 案例 - 本地生活(列表页面)(三十)
【微信小程序】-- 案例 - 本地生活(列表页面)(三十)