python str.extract提取小数+表inner内连接后,行数多于之前

简介: python str.extract提取小数+表inner内连接后,行数多于之前

写在最前面

读取某列信息,且仅保留数字。

本文首次发表时间为:2023-01-28 23:18:47

由于质量分过低,因此对本文进行完善更新

主要补充为一些python小技巧的介绍,如列表解析、collections.Counterzipenumerate以及pandas库的使用。这些技巧和工具可以加快数据处理的速度,并提高代码的可读性。

原文

str.extract提取小数

注意:

提取小数代码为:

.str.extract('(\d+\.?\d*)', expand=False)

提取整数代码为:

.str.extract('(\d+)', expand=False)

读取某列信息,且仅保留数字

# 读取这一列中的信息,保留数字
def numOnly(col_names):
    for col_name in col_names:
        b[col_name] = b[col_name].str.extract('(\d+)', expand=False)
    index_start = b.columns.get_loc("血小板计数")
    index_end = b.columns.get_loc("谷丙转氨酶")
    for column_index in range(index_start,index_end+1):
        b.iloc[:,column_index] = b.iloc[:,column_index].str.extract('(\d+\.?\d*)', expand=False)
    index_start = b.columns.get_loc("手术_出血量ml")
    index_end = b.columns.get_loc("详情_Apgar评分(高)")
    for column_index in range(index_start,index_end+1):
        b.iloc[:,column_index] = b.iloc[:,column_index].str.extract('(\d+\.?\d*)', expand=False)
    return True

python 表inner内连接后,行数多于之前

原因:有重复的表连接字段

修改:

c.drop_duplicates(subset=["就诊标识(医渡云计算)"], keep='last',inplace=True)
c.shape

解决:

完美!!

完善

Python数据处理的小技巧

Python是一种强大的编程语言,非常适合数据处理和分析任务。

在这篇博客中,我们将分享一些Python数据处理中的小技巧,这些技巧可以帮助更高效地处理数据。

1. 使用列表解析进行数据转换

列表解析是一种精炼的方式来处理列表中的元素,它可以在一行代码中完成许多操作,如映射、筛选和转换。以下是一个示例,将一个列表中的所有元素加倍:

original_list = [1, 2, 3, 4, 5]
doubled_list = [x * 2 for x in original_list]
print(doubled_list)

2. 使用collections.Counter统计元素出现次数

collections.Counter是一个强大的工具,用于统计可迭代对象中元素的出现次数。以下是一个示例,统计字符串中字符出现的次数:

from collections import Counter
text = "Hello, World!"
char_count = Counter(text)
print(char_count)

3. 使用zip函数同时迭代多个列表

zip函数允许您同时迭代多个列表,这对于处理多个相关的列表非常有用。以下是一个示例,同时迭代两个列表:

names = ["Alice", "Bob", "Charlie"]
scores = [85, 92, 78]
for name, score in zip(names, scores):
    print(f"{name}: {score}")

4. 使用enumerate获取元素的索引

enumerate函数允许您获取可迭代对象中元素的索引,这在需要同时访问索引和元素时非常有用。以下是一个示例:

fruits = ["apple", "banana", "cherry"]
for index, fruit in enumerate(fruits):
    print(f"Index {index}: {fruit}")

5. 使用pandas进行数据分析

pandas是一个强大的Python库,用于数据处理和分析。它提供了数据结构和函数,可以轻松处理和分析大量数据。以下是一个示例,使用pandas加载和分析CSV文件:

import pandas as pd
data = pd.read_csv('data.csv')
print(data.head())

结语

Python提供了丰富的工具和库,可以帮助您更高效地处理数据。在实际工作中,掌握这些技巧以及其他数据处理技术是非常重要的,可以大大提高生产力和分析能力。

目录
相关文章
|
16天前
|
Python
python保存两位小数的几种方法,python2保留小数
python保存两位小数的几种方法,python2保留小数
51 2
|
20天前
|
NoSQL Unix 网络安全
【Azure Cache for Redis】Python Django-Redis连接Azure Redis服务遇上(104, 'Connection reset by peer')
【Azure Cache for Redis】Python Django-Redis连接Azure Redis服务遇上(104, 'Connection reset by peer')
【Azure Cache for Redis】Python Django-Redis连接Azure Redis服务遇上(104, 'Connection reset by peer')
|
1月前
|
Python
Python计算误码率,输入是0-1比特流矩阵和小数矩阵
本文提供了一个Python函数calculate_ber,用于计算两个NumPy矩阵表示的二进制信号和接收信号之间的误码率(BER),其中包括信号与接收信号的比较、误差计数以及BER的计算过程,并给出了具体的使用示例。
37 2
|
2月前
|
存储 程序员 Python
小白也能用的代码!1行Python,把PPT转成1张长图
大家好,我是程序员晚枫。今天介绍`python-office`库的新功能:仅用1行Python代码将PPT转为单张长图。
65 11
 小白也能用的代码!1行Python,把PPT转成1张长图
|
1月前
|
机器学习/深度学习 数据可视化 Python
如何可视化神经网络的神经元节点之间的连接?附有Python预处理代码
该博客展示了如何通过Python预处理神经网络权重矩阵并将其导出为表格,然后使用Chiplot网站来可视化神经网络的神经元节点之间的连接。
33 0
如何可视化神经网络的神经元节点之间的连接?附有Python预处理代码
|
1月前
|
数据可视化 搜索推荐 数据挖掘
基于Python flask 的数据可视化平台,可定制,可连接数据库
本文介绍了一个基于Python Flask框架开发的可定制数据可视化平台,该平台支持多种数据库连接,并提供丰富的图表类型和个性化设置,以实现交互式数据分析和展示。
基于Python flask 的数据可视化平台,可定制,可连接数据库
|
20天前
|
缓存 NoSQL 网络安全
【Azure Redis 缓存】 Python连接Azure Redis, 使用redis.ConnectionPool 出现 "ConnectionResetError: [Errno 104] Connection reset by peer"
【Azure Redis 缓存】 Python连接Azure Redis, 使用redis.ConnectionPool 出现 "ConnectionResetError: [Errno 104] Connection reset by peer"
|
21天前
|
存储 API 开发工具
【Azure Developer】使用 Python SDK连接Azure Storage Account, 计算Blob大小代码示例
【Azure Developer】使用 Python SDK连接Azure Storage Account, 计算Blob大小代码示例
|
24天前
|
网络协议 Python
python requests库如何使用http连接池降低延迟 keepalive复用连接
Python的`requests`库通过内置的连接池机制支持HTTP Keep-Alive特性,允许复用TCP连接以发送多个请求,减少连接开销。默认情况下,`requests`不显式禁用Keep-Alive,其行为取决于底层HTTP库(如urllib3)及服务器的支持。通过创建`Session`对象并自定义`HTTPAdapter`,可以调整连接池大小和重试策略,进一步优化连接复用。测试显示,使用`Session`和定制的`HTTPAdapter`比普通请求方法能显著减少连续请求间的时间消耗,体现了Keep-Alive的优势。
|
2月前
|
存储 Java 网络安全
如何使用Python批量连接网络设备?
【7月更文挑战第4天】
43 1
如何使用Python批量连接网络设备?