Python实战系列<二> | 70万+条表格信息标记

简介: Python实战系列<二> | 70万+条表格信息标记

大家好,我是欧K~

本期给大家分享《Python实战系列》的第二篇文章:表格信息标记,该系列主要来自粉丝的实际问题,后期会不断更新,希望对你有所帮助,如有疑问或者需要改进的地方可以私信小编。上一期:【Python实战系列<一> | 正则提取数据并绘图
任务描述: 根据基准血压表标记儿童青少年血压表中的血压类型:

  • 舒张压和收缩压任意一个比高血压标准高就输出成高血压
  • 收缩压和舒张压都比高血压早期小就输出成正常
  • 其他就是高血压早期

基准血压表

儿童血压表

🏳️‍🌈 1. 读取数据

df1 = pd.read_excel('./基准血压表.xlsx')


df2 = pd.read_excel('./青少年血压表.xlsx')



🏳️‍🌈 2. 基准血压表身高列数据处理这里需要将每个身高范围处理成两个值:hight_min、hight_max

hight_min = []
hight_max = []
hights = df1['身高(cm)'].values.tolist()
for h in hights:
    h1 = 0
    h2 = 0
    if '<' in h:
        h2 = int(h[1:])
        h1 = h2-50
    elif '>' in h:
        h1 = int(h[1:])
        h2 = h1+50
    else:
        data = h.split('-')
        h1 = int(data[0])
        h2 = int(data[1])
    hight_min.append(h1)
    hight_max.append(h2)
df1['hight_min'] = hight_min
df1['hight_max'] = hight_max



🏳️‍🌈 3. 基准血压表性别列数据处理可以选择处理基准血压表或者青少年血压表,只要两个统一就可以了,这里我们处理基准血压表。

df1['性别'] = df1['性别'].replace({'男':'Boy','女':'Girl'})


🏳️‍🌈 4. 计算青少年血压表血压类型

result_lst = []
for i in range(dff.shape[0]):
    result = '-'
    sexna = df2.loc[i,'sexna']
    age = df2.loc[i,'age']
    sg = df2.loc[i,'身高']
    szy = df2.loc[i,'舒张压']
    ssy = df2.loc[i,'收缩压']
    df_tmp = df1[(df1['性别'] == sexna) & (df1['年龄(岁)'] == age) & (df1['hight_min'] <= sg) & (df1['hight_max'] > sg)]
    if df_tmp.shape[0] == 0:
        result_lst.append(result)
        continue
    if ssy >= df_tmp.iloc[0,4] or szy >= df_tmp.iloc[0,6]:
        result = '高血压'
    elif ssy < df_tmp.iloc[0,4] and szy < df_tmp.iloc[0,6]:
        result = '正常'
    else:
        result = '高血压早期'
    result_lst.append(result)
df2_tmp['结果'] = result_lst

前20000条:


🏳️‍🌈 5. 输出结果

这样70多万数据一会儿就处理完成了,要是硬算的话就麻了

END


以上就是本期为大家整理的全部内容了,喜欢的朋友可以点赞、点在看也可以分享让更多人知道。

相关文章
|
2天前
|
调度 开发者 UED
探索Python中的异步编程:从基础到实战
【9月更文挑战第30天】在编程的世界里,异步编程是一个强大的概念,它允许程序在等待某些操作完成时继续执行其他任务。本文将深入探讨Python中的异步编程,从理解其基本概念开始,逐步过渡到高级应用。我们将通过具体的代码示例来展示如何在实际项目中实现异步功能,从而提高应用程序的性能和响应性。无论你是初学者还是有经验的开发者,这篇文章都将为你提供宝贵的见解和实用技巧。
|
4天前
|
Python
Python量化炒股的数据信息获取—获取沪深股市每日成交概况信息
Python量化炒股的数据信息获取—获取沪深股市每日成交概况信息
16 5
|
4天前
|
Python
Python量化炒股的数据信息获取—获取上市公司分红送股数据信息
Python量化炒股的数据信息获取—获取上市公司分红送股数据信息
15 3
|
6天前
|
数据采集 人工智能 程序员
探索Python编程:从基础到实战
【9月更文挑战第27天】在这篇文章中,我们将一起踏上一段激动人心的Python编程之旅。无论你是初学者还是有一定经验的开发者,这里都有适合你的内容。文章将通过浅显易懂的语言带你了解Python的基础语法,并通过实际案例展示如何将这些知识应用于解决现实问题。准备好,我们即将启程!
|
4天前
|
Python
Python量化炒股的数据信息获取— 获取上市公司股东和股本信息
Python量化炒股的数据信息获取— 获取上市公司股东和股本信息
12 0
|
5天前
|
网络协议 网络安全 Python
Python 通过UDP传输超过64k的信息
Python 通过UDP传输超过64k的信息
17 0
|
6天前
|
Python
python编程获取《续蜀山剑侠传》目录信息:目录名称和网址
python编程获取《续蜀山剑侠传》目录信息:目录名称和网址
|
6天前
|
网络协议 网络安全 Python
Python 通过UDP传输超过64k的信息
Python 通过UDP传输超过64k的信息 原创
19 0
|
Python
PYTHON实战两数之和
1. 两数之和 难度:简单 收藏 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。 你可以按任意顺序返回答案。
182 0
PYTHON实战两数之和
|
4天前
|
数据挖掘 索引 Python
Python数据挖掘编程基础3
字典在数学上是一个映射,类似列表但使用自定义键而非数字索引,键在整个字典中必须唯一。可以通过直接赋值、`dict`函数或`dict.fromkeys`创建字典,并通过键访问元素。集合是一种不重复且无序的数据结构,可通过花括号或`set`函数创建,支持并集、交集、差集和对称差集等运算。
14 9
下一篇
无影云桌面