Python实战系列<二> | 70万+条表格信息标记

简介: Python实战系列<二> | 70万+条表格信息标记

大家好,我是欧K~

本期给大家分享《Python实战系列》的第二篇文章:表格信息标记,该系列主要来自粉丝的实际问题,后期会不断更新,希望对你有所帮助,如有疑问或者需要改进的地方可以私信小编。上一期:【Python实战系列<一> | 正则提取数据并绘图
任务描述: 根据基准血压表标记儿童青少年血压表中的血压类型:

  • 舒张压和收缩压任意一个比高血压标准高就输出成高血压
  • 收缩压和舒张压都比高血压早期小就输出成正常
  • 其他就是高血压早期

基准血压表

儿童血压表

🏳️‍🌈 1. 读取数据

df1 = pd.read_excel('./基准血压表.xlsx')


df2 = pd.read_excel('./青少年血压表.xlsx')



🏳️‍🌈 2. 基准血压表身高列数据处理这里需要将每个身高范围处理成两个值:hight_min、hight_max

hight_min = []
hight_max = []
hights = df1['身高(cm)'].values.tolist()
for h in hights:
    h1 = 0
    h2 = 0
    if '<' in h:
        h2 = int(h[1:])
        h1 = h2-50
    elif '>' in h:
        h1 = int(h[1:])
        h2 = h1+50
    else:
        data = h.split('-')
        h1 = int(data[0])
        h2 = int(data[1])
    hight_min.append(h1)
    hight_max.append(h2)
df1['hight_min'] = hight_min
df1['hight_max'] = hight_max



🏳️‍🌈 3. 基准血压表性别列数据处理可以选择处理基准血压表或者青少年血压表,只要两个统一就可以了,这里我们处理基准血压表。

df1['性别'] = df1['性别'].replace({'男':'Boy','女':'Girl'})


🏳️‍🌈 4. 计算青少年血压表血压类型

result_lst = []
for i in range(dff.shape[0]):
    result = '-'
    sexna = df2.loc[i,'sexna']
    age = df2.loc[i,'age']
    sg = df2.loc[i,'身高']
    szy = df2.loc[i,'舒张压']
    ssy = df2.loc[i,'收缩压']
    df_tmp = df1[(df1['性别'] == sexna) & (df1['年龄(岁)'] == age) & (df1['hight_min'] <= sg) & (df1['hight_max'] > sg)]
    if df_tmp.shape[0] == 0:
        result_lst.append(result)
        continue
    if ssy >= df_tmp.iloc[0,4] or szy >= df_tmp.iloc[0,6]:
        result = '高血压'
    elif ssy < df_tmp.iloc[0,4] and szy < df_tmp.iloc[0,6]:
        result = '正常'
    else:
        result = '高血压早期'
    result_lst.append(result)
df2_tmp['结果'] = result_lst

前20000条:


🏳️‍🌈 5. 输出结果

这样70多万数据一会儿就处理完成了,要是硬算的话就麻了

END


以上就是本期为大家整理的全部内容了,喜欢的朋友可以点赞、点在看也可以分享让更多人知道。

相关文章
|
3月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
490 7
|
3月前
|
数据采集 Web App开发 数据安全/隐私保护
实战:Python爬虫如何模拟登录与维持会话状态
实战:Python爬虫如何模拟登录与维持会话状态
|
3月前
|
传感器 运维 前端开发
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
本文解析异常(anomaly)与新颖性(novelty)检测的本质差异,结合distfit库演示基于概率密度拟合的单变量无监督异常检测方法,涵盖全局、上下文与集体离群值识别,助力构建高可解释性模型。
391 10
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
|
3月前
|
数据采集 监控 数据库
Python异步编程实战:爬虫案例
🌟 蒋星熠Jaxonic,代码为舟的星际旅人。从回调地狱到async/await协程天堂,亲历Python异步编程演进。分享高性能爬虫、数据库异步操作、限流监控等实战经验,助你驾驭并发,在二进制星河中谱写极客诗篇。
Python异步编程实战:爬虫案例
|
3月前
|
Cloud Native 算法 API
Python API接口实战指南:从入门到精通
🌟蒋星熠Jaxonic,技术宇宙的星际旅人。深耕API开发,以Python为舟,探索RESTful、GraphQL等接口奥秘。擅长requests、aiohttp实战,专注性能优化与架构设计,用代码连接万物,谱写极客诗篇。
Python API接口实战指南:从入门到精通
|
3月前
|
存储 分布式计算 测试技术
Python学习之旅:从基础到实战第三章
总体来说,第三章是Python学习路程中的一个重要里程碑,它不仅加深了对基础概念的理解,还引入了更多高级特性,为后续的深入学习和实际应用打下坚实的基础。通过这一章的学习,读者应该能够更好地理解Python编程的核心概念,并准备好应对更复杂的编程挑战。
151 12
|
3月前
|
存储 数据采集 监控
Python文件操作全攻略:从基础到高级实战
本文系统讲解Python文件操作核心技巧,涵盖基础读写、指针控制、异常处理及大文件分块处理等实战场景。结合日志分析、CSV清洗等案例,助你高效掌握文本与二进制文件处理,提升程序健壮性与开发效率。(238字)
416 1
|
3月前
|
存储 Java 调度
Python定时任务实战:APScheduler从入门到精通
APScheduler是Python强大的定时任务框架,通过触发器、执行器、任务存储和调度器四大组件,灵活实现各类周期性任务。支持内存、数据库、Redis等持久化存储,适用于Web集成、数据抓取、邮件发送等场景,解决传统sleep循环的诸多缺陷,助力构建稳定可靠的自动化系统。(238字)
717 1
|
3月前
|
Java 调度 数据库
Python threading模块:多线程编程的实战指南
本文深入讲解Python多线程编程,涵盖threading模块的核心用法:线程创建、生命周期、同步机制(锁、信号量、条件变量)、线程通信(队列)、守护线程与线程池应用。结合实战案例,如多线程下载器,帮助开发者提升程序并发性能,适用于I/O密集型任务处理。
390 0
|
3月前
|
机器学习/深度学习 监控 数据挖掘
Python 高效清理 Excel 空白行列:从原理到实战
本文介绍如何使用Python的openpyxl库自动清理Excel中的空白行列。通过代码实现高效识别并删除无数据的行与列,解决文件臃肿、读取错误等问题,提升数据处理效率与准确性,适用于各类批量Excel清理任务。
460 0

推荐镜像

更多