【python】python职业人群体检数据分析(代码+数据)【独一无二】

简介: 【python】python职业人群体检数据分析(代码+数据)【独一无二】


👉博__主👈:米码收割机

👉技__能👈:C++/Python语言

👉公众号👈:测试开发自动化【获取源码+商业合作】

👉荣__誉👈:阿里云博客专家博主、51CTO技术博主

👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。



1. 任务描述

有的职业危害因素对人体血液等系统产生影响,在此针对一次职业人群体检的部分数据使用Python进行数据分析和可视化描述。

要求:

1.导入模块:pandas、numpy、matplotlib.pyplot;定义可以正常显示中文标签和负号;

2.获取数据,导入待处理数据testdata.xls,并显示前5行;

3.分析数据

  • 查看data的数据类型、表结构、并统计各字段空缺的个数;
  • 删除全为空的列及身份证号为空的数据;
  • 将“开始从事某工作年份”规范为4位数字年份,如“2018”,并将列名修改为“参加工作时间”;
  • 增加列“工龄”(体检年份-参加工作时间)和“年龄”(体检时间-出生年份)两列;
  • 统计不同性别的白细胞计数均值,并画出柱状图;
  • 统计不同年龄段的白细胞计数,并画出柱状图,年龄段划分为:小于等于30,31至40,41至50以及大于50四个段。

👇👇👇 关注公众号,回复 “体检数据分析” 获取源码👇👇👇


2. 功能展示

2.1 导入模块获取数据

2.2 分析数据类型数

👇👇👇 关注公众号,回复 “体检数据分析” 获取源码👇👇👇

2.3 分析数据表结构、并统计各字段空缺的个数

2.4 统计各字段空缺的个数

2.5 删除全为空的列及身份证号为空的数据

👇👇👇 关注公众号,回复 “体检数据分析” 获取源码👇👇👇

2.6 将列名修改为“参加工作时间”

2.7 增加列“工龄”和“年龄”

👇👇👇 关注公众号,回复 “体检数据分析” 获取源码👇👇👇

2.8 统计不同性别的白细胞计数均值柱状图

2.9 统计不同年龄段的白细胞计数柱状图

👇👇👇 关注公众号,回复 “体检数据分析” 获取源码👇👇👇


三、部分代码

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
df = pd.read_excel("testdata.xls")
data = df.head()#默认读取前5行的数据
print(df.info())
print(df.dtypes)
print(df.shape)
print(df.isnull().sum())
# 其余代码略....
# 👇👇👇 关注公众号,回复 “体检数据分析” 获取源码👇👇👇

👇👇👇 关注公众号,回复 “体检数据分析” 获取源码👇👇👇


相关文章
|
9月前
|
存储 算法 调度
【复现】【遗传算法】考虑储能和可再生能源消纳责任制的售电公司购售电策略(Python代码实现)
【复现】【遗传算法】考虑储能和可再生能源消纳责任制的售电公司购售电策略(Python代码实现)
415 26
|
8月前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
5610 1
|
9月前
|
测试技术 开发者 Python
Python单元测试入门:3个核心断言方法,帮你快速定位代码bug
本文介绍Python单元测试基础,详解`unittest`框架中的三大核心断言方法:`assertEqual`验证值相等,`assertTrue`和`assertFalse`判断条件真假。通过实例演示其用法,帮助开发者自动化检测代码逻辑,提升测试效率与可靠性。
586 1
|
8月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
704 0
|
8月前
|
JSON 算法 API
Python采集淘宝商品评论API接口及JSON数据返回全程指南
Python采集淘宝商品评论API接口及JSON数据返回全程指南
|
8月前
|
JSON API 数据安全/隐私保护
Python采集淘宝拍立淘按图搜索API接口及JSON数据返回全流程指南
通过以上流程,可实现淘宝拍立淘按图搜索的完整调用链路,并获取结构化的JSON商品数据,支撑电商比价、智能推荐等业务场景。
|
8月前
|
测试技术 Python
Python装饰器:为你的代码施展“魔法”
Python装饰器:为你的代码施展“魔法”
379 100
|
8月前
|
开发者 Python
Python列表推导式:一行代码的艺术与力量
Python列表推导式:一行代码的艺术与力量
571 95
|
9月前
|
Python
Python的简洁之道:5个让代码更优雅的技巧
Python的简洁之道:5个让代码更优雅的技巧
380 104
|
9月前
|
开发者 Python
Python神技:用列表推导式让你的代码更优雅
Python神技:用列表推导式让你的代码更优雅
664 99

推荐镜像

更多