关于睡眠健康数据集的探索

简介: 关于睡眠健康数据集的探索

一、项目描述


1.背景描述


本数据集涵盖了与睡眠和日常习惯有关的诸多变量。如性别、年龄、职业、睡眠时间、睡眠质量、身体活动水平、压力水平、BMI类别、血压、心率、每日步数、以及是否有睡眠障碍等细节。


2.数据说明


解释说明:睡眠障碍

类型 说明
没有表现出任何特定的睡眠障碍。
失眠 有入睡或保持睡眠的困难,导致睡眠不足或质量差
睡眠呼吸暂停 在睡眠过程中出现呼吸暂停,导致睡眠模式紊乱和潜在的健康风险


3.数据来源


www.kaggle.com/datasets/uo…


4.问题描述


全面的睡眠指标:探索睡眠时间、质量和影响睡眠模式的因素。

生活方式因素:分析身体活动水平、压力水平和BMI类别。

心血管健康:检查血压和心率测量。

睡眠障碍分析:识别睡眠障碍的发生,如失眠和睡眠呼吸暂停。


二、数据分析


1.数据读取


import pandas as pd
# encoding要设置,moren utf-8打不开
data=pd.read_csv('Sleep_health_and_lifestyle_dataset.csv',encoding='gb2312')
data.head()

.dataframe tbody tr th:only-of-type {         vertical-align: middle;     } .dataframe tbody tr th {     vertical-align: top; } .dataframe thead th {     text-align: right; }

ID 性别 年龄 职业 睡眠时长 睡眠质量 身体活动水平 压力水平 BMI 血压 心率 每日步数 睡眠障碍
0 1 男性 27 软件工程师 6.1 6 42 6 超重 126/83 77 4200
1 2 男性 28 医生 6.2 6 60 8 正常 125/80 75 10000
2 3 男性 28 医生 6.2 6 60 8 正常 125/80 75 10000
3 4 男性 28 销售代表 5.9 4 30 8 肥胖 140/90 85 3000 睡眠呼吸暂停
4 5 男性 28 销售代表 5.9 4 30 8 肥胖 140/90 85 3000 睡眠呼吸暂停


2.值范围分析


data.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 374 entries, 0 to 373
Data columns (total 13 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   ID      374 non-null    int64  
 1   性别      374 non-null    object 
 2   年龄      374 non-null    int64  
 3   职业      374 non-null    object 
 4   睡眠时长    374 non-null    float64
 5   睡眠质量    374 non-null    int64  
 6   身体活动水平  374 non-null    int64  
 7   压力水平    374 non-null    int64  
 8   BMI     374 non-null    object 
 9   血压      374 non-null    object 
 10  心率      374 non-null    int64  
 11  每日步数    374 non-null    int64  
 12  睡眠障碍    374 non-null    object 
dtypes: float64(1), int64(7), object(5)
memory usage: 38.1+ KB

分析可见无空值


3.值范围分析


data['BMI'].unique()
array(['超重', '正常', '肥胖'], dtype=object)
data['睡眠障碍'].unique()
array(['无', '睡眠呼吸暂停', '失眠'], dtype=object)
data['职业'].unique()
array(['软件工程师', '医生', '销售代表', '老师', '护士', '工程师', '会计师', '科学家', '律师',       '营业员', '主管'], dtype=object)
data['性别'].unique()
array(['男性', '女性'], dtype=object)
data['血压'].unique()
array(['126/83', '125/80', '140/90', '120/80', '132/87', '130/86',       '117/76', '118/76', '128/85', '131/86', '128/84', '115/75',       '135/88', '129/84', '130/85', '115/78', '119/77', '121/79',       '125/82', '135/90', '122/80', '142/92', '140/95', '139/91',       '118/75'], dtype=object)


4.血压处理


data = pd.concat([data,data['血压'].str.split('/',expand = True)],axis = 1)
data.rename({0:'收缩压',1:'舒张压'},inplace=True,axis=1) 
data['收缩压']=data['收缩压'].astype('float32')
data['舒张压']=data['舒张压'].astype('float32')
data.drop('血压', axis=1)
data.head()

.dataframe tbody tr th:only-of-type {         vertical-align: middle;     } .dataframe tbody tr th {     vertical-align: top; } .dataframe thead th {     text-align: right; }

ID 性别 年龄 职业 睡眠时长 睡眠质量 身体活动水平 压力水平 BMI 血压 心率 每日步数 睡眠障碍 收缩压 舒张压
0 1 男性 27 软件工程师 6.1 6 42 6 超重 126/83 77 4200 126.0 83.0
1 2 男性 28 医生 6.2 6 60 8 正常 125/80 75 10000 125.0 80.0
2 3 男性 28 医生 6.2 6 60 8 正常 125/80 75 10000 125.0 80.0
3 4 男性 28 销售代表 5.9 4 30 8 肥胖 140/90 85 3000 睡眠呼吸暂停 140.0 90.0
4 5 男性 28 销售代表 5.9 4 30 8 肥胖 140/90 85 3000 睡眠呼吸暂停 140.0 90.0


5.热力图


import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline 
plt.figure(figsize=(10,6))
sns.heatmap(data.drop('ID',axis=1).corr(),annot=True,fmt="1.1f");

1696837816531.jpg

目录
相关文章
|
数据挖掘 数据库
睡眠健康数据分析(上)
睡眠健康数据分析
700 0
|
计算机视觉
YOLOv5改进 | 检测头篇 | 增加辅助检测头利用AFPN改进Head(附详细修改教程)
YOLOv5改进 | 检测头篇 | 增加辅助检测头利用AFPN改进Head(附详细修改教程)
880 0
Jupyter-notebook 常用快捷键
Jupyter-notebook 常用快捷键
649 0
|
3月前
|
人工智能 JavaScript 安全
设计稿一键变代码,VTJ.PRO 让想象与实现再无距离。
VTJ.PRO联合MasterGo推出智能设计识别引擎,助力设计师高效生成Vue组件代码,打通设计与开发协作壁垒,提升团队效率。限时领取百万AI额度,开启智能开发新时代!
100 0
|
自然语言处理 编译器 Linux
【Latex】texstudio使用和ACL论文模板初步解读
LaTeX是一类用于编辑和排版的软件,用于生成PDF文档。 LaTeX编辑和排版的核心思想在于,通过\section和\paragraph等语句,规定了每一句话在文章中所从属的层次,从而极大方便了对各个层次批量处理。 LaTeX在使用体验方
2117 0
【Latex】texstudio使用和ACL论文模板初步解读
|
机器学习/深度学习 存储 监控
Elasticsearch 在日志分析中的应用
【9月更文第2天】随着数字化转型的推进,日志数据的重要性日益凸显。日志不仅记录了系统的运行状态,还提供了宝贵的洞察,帮助企业改进产品质量、优化用户体验以及加强安全防护。Elasticsearch 作为一个分布式搜索和分析引擎,因其出色的性能和灵活性,成为了日志分析领域的首选工具之一。本文将探讨如何使用 Elasticsearch 作为日志分析平台的核心组件,并详细介绍 ELK(Elasticsearch, Logstash, Kibana)栈的搭建和配置流程。
819 4
|
12月前
|
传感器 监控 物联网
基于STM32+微波雷达设计的非接触式睡眠监控系统
本项目开发一种非接触式的睡眠监控系统,该系统利用先进的60GHz毫米波雷达技术和STM32微控制器,实现了对人体在睡眠过程中的存在感知、运动感知以及生理指标如呼吸频率、心率的实时监测。系统能够自动评估睡眠质量,并在用户睡眠周期结束时提供睡眠评分。为了确保用户能够在任何地点了解自己的睡眠状况,系统集成了Wi-Fi模块,可以将收集到的数据上传至华为云物联网平台,并通过专门设计的移动应用程序供用户远程访问。此外,系统还具备超阈值报警功能,当检测到异常的生理指标时会发出警报提醒。本地1.44寸TFT LCD显示屏用于实时显示监测到的信息,包括生理指标和环境数据。为了全面监测用户的健康状况,系统还加入了
1483 1
基于STM32+微波雷达设计的非接触式睡眠监控系统
|
机器学习/深度学习 数据可视化 搜索推荐
使用Python实现深度学习模型:智能睡眠监测与分析
使用Python实现深度学习模型:智能睡眠监测与分析
1321 2
|
12月前
|
数据挖掘 API 数据安全/隐私保护
淘宝商品 API 接口怎样去使用?
淘宝商品API接口为开发者和企业提供了一种强大的工具,用于高效获取和利用淘宝平台上的商品数据。本文详细介绍了从注册成为淘宝开发者、申请API权限、获取API密钥,到阅读API文档、搭建开发环境、调用API接口、处理响应结果及数据应用的全过程。通过实际案例展示了如何利用淘宝商品API接口提升电商平台和价格比较网站的竞争力,并强调了使用过程中的注意事项,如遵守API使用规范、数据安全与隐私保护等。
1857 0
|
Linux 测试技术 网络安全
【好玩的开源项目】Linux系统之部署吃豆人经典小游戏
【7月更文挑战第18天】Linux系统之部署吃豆人经典小游戏
232 3