Python实战系列<二> | 70万+条表格信息标记

简介: Python实战系列<二> | 70万+条表格信息标记

大家好,我是欧K~

本期给大家分享《Python实战系列》的第二篇文章:表格信息标记,该系列主要来自粉丝的实际问题,后期会不断更新,希望对你有所帮助,如有疑问或者需要改进的地方可以私信小编。上一期:【Python实战系列<一> | 正则提取数据并绘图
任务描述: 根据基准血压表标记儿童青少年血压表中的血压类型:

  • 舒张压和收缩压任意一个比高血压标准高就输出成高血压
  • 收缩压和舒张压都比高血压早期小就输出成正常
  • 其他就是高血压早期

基准血压表

儿童血压表

🏳️‍🌈 1. 读取数据

df1 = pd.read_excel('./基准血压表.xlsx')


df2 = pd.read_excel('./青少年血压表.xlsx')



🏳️‍🌈 2. 基准血压表身高列数据处理这里需要将每个身高范围处理成两个值:hight_min、hight_max

hight_min = []
hight_max = []
hights = df1['身高(cm)'].values.tolist()
for h in hights:
    h1 = 0
    h2 = 0
    if '<' in h:
        h2 = int(h[1:])
        h1 = h2-50
    elif '>' in h:
        h1 = int(h[1:])
        h2 = h1+50
    else:
        data = h.split('-')
        h1 = int(data[0])
        h2 = int(data[1])
    hight_min.append(h1)
    hight_max.append(h2)
df1['hight_min'] = hight_min
df1['hight_max'] = hight_max



🏳️‍🌈 3. 基准血压表性别列数据处理可以选择处理基准血压表或者青少年血压表,只要两个统一就可以了,这里我们处理基准血压表。

df1['性别'] = df1['性别'].replace({'男':'Boy','女':'Girl'})


🏳️‍🌈 4. 计算青少年血压表血压类型

result_lst = []
for i in range(dff.shape[0]):
    result = '-'
    sexna = df2.loc[i,'sexna']
    age = df2.loc[i,'age']
    sg = df2.loc[i,'身高']
    szy = df2.loc[i,'舒张压']
    ssy = df2.loc[i,'收缩压']
    df_tmp = df1[(df1['性别'] == sexna) & (df1['年龄(岁)'] == age) & (df1['hight_min'] <= sg) & (df1['hight_max'] > sg)]
    if df_tmp.shape[0] == 0:
        result_lst.append(result)
        continue
    if ssy >= df_tmp.iloc[0,4] or szy >= df_tmp.iloc[0,6]:
        result = '高血压'
    elif ssy < df_tmp.iloc[0,4] and szy < df_tmp.iloc[0,6]:
        result = '正常'
    else:
        result = '高血压早期'
    result_lst.append(result)
df2_tmp['结果'] = result_lst

前20000条:


🏳️‍🌈 5. 输出结果

这样70多万数据一会儿就处理完成了,要是硬算的话就麻了

END


以上就是本期为大家整理的全部内容了,喜欢的朋友可以点赞、点在看也可以分享让更多人知道。

相关文章
|
5天前
|
开发工具 Python
2024年Python最全使用Python求解方程_python解方程,2024年最新面试高分实战
2024年Python最全使用Python求解方程_python解方程,2024年最新面试高分实战
2024年Python最全使用Python求解方程_python解方程,2024年最新面试高分实战
|
1天前
|
机器学习/深度学习 网络协议 数据库
Python编程实战:解决常见编程问题
```markdown Python编程入门指南:涵盖文件操作、列表操作、字符串处理、函数编写、异常处理、网络编程和数据库操作等实战案例。通过示例代码,学习如何读写文件、排序列表、转换字符串、创建函数、处理异常、构建TCP服务器及操作SQLite数据库,逐步掌握Python核心技能。 ```
|
1天前
|
应用服务中间件 数据库 nginx
Python Web开发实战:从搭建博客到部署上线
使用Python和Flask初学者指南:从搭建简单博客到部署上线。文章详细介绍了如何从零开始创建一个博客系统,包括准备Python环境、使用Flask和SQLite构建应用、设计数据库模型、创建视图函数和HTML模板,以及整合所有组件。最后,简述了如何通过Gunicorn和Nginx将应用部署到Linux服务器。
|
3天前
|
机器学习/深度学习 算法 数据挖掘
4小时学完!15年技术大牛用247个实战案例剖析的Python教程
今天给小伙伴们分享一份15年技术大牛用247个实战案例剖析的Python教程,这份教程全程彩图讲解,告别枯燥!60秒学会⼀个⼩例⼦,带你系统学习Python,从⼊门到⼤师。 涵盖了Python基础、Python字符串和正则、Python⽂件和⽇期、Python三⼤利器、Python绘图、Python之坑、Python第三⽅包、机器学习和深度学必知算法、Python实战、Pandas数据分析案例实战十大篇幅的精品案例教程
|
5天前
|
网络协议 Python
在python中利用TCP协议编写简单网络通信程序,要求服务器端和客户端进行信息互传。 - 蓝易云
在这个示例中,服务器端创建一个socket并监听本地的12345端口。当客户端连接后,服务器发送一条欢迎消息,然后关闭连接。客户端创建一个socket,连接到服务器,接收消息,然后关闭连接。
58 0
|
5天前
|
数据采集 数据挖掘 计算机视觉
最全OpenCV-Python实战(3)——OpenCV中绘制图形与文本,面试官必问问题及答案
最全OpenCV-Python实战(3)——OpenCV中绘制图形与文本,面试官必问问题及答案
|
5天前
|
Python
2024年最全用Python和PIL美化图像:文本覆盖技术实战,Python高级面试题pdf
2024年最全用Python和PIL美化图像:文本覆盖技术实战,Python高级面试题pdf
|
5天前
|
索引 Python
真的!千万不要忽略这些python常见报错信息_nameerror name ‘a‘ is not defined
真的!千万不要忽略这些python常见报错信息_nameerror name ‘a‘ is not defined
|
6天前
|
数据采集 存储 数据挖掘
Python DataFrame初学者指南:轻松上手构建数据表格
【5月更文挑战第19天】本文是针对初学者的Pandas DataFrame指南,介绍如何安装Pandas、创建DataFrame(从字典或CSV文件)、查看数据(`head()`, `info()`, `describe()`)、选择与操作数据(列、行、缺失值处理、数据类型转换、排序、分组聚合)以及保存DataFrame到CSV文件。通过学习这些基础,你将能轻松开始数据科学之旅。
|
6天前
|
数据挖掘 数据处理 Python
【Python DataFrame 专栏】Python DataFrame 入门指南:从零开始构建数据表格
【5月更文挑战第19天】本文介绍了Python数据分析中的核心概念——DataFrame,通过导入`pandas`库创建并操作DataFrame。示例展示了如何构建数据字典并转换为DataFrame,以及进行数据选择、添加修改列、计算统计量、筛选和排序等操作。DataFrame适用于处理各种规模的表格数据,是数据分析的得力工具。掌握其基础和应用是数据分析之旅的重要起点。
【Python DataFrame 专栏】Python DataFrame 入门指南:从零开始构建数据表格