写在最前面
读取某列信息,且仅保留数字。
本文首次发表时间为:2023-01-28 23:18:47
由于质量分过低,因此对本文进行完善更新
主要补充为一些python小技巧的介绍,如列表解析、collections.Counter
、zip
、enumerate
以及pandas
库的使用。这些技巧和工具可以加快数据处理的速度,并提高代码的可读性。
原文
str.extract提取小数
注意:
提取小数代码为:
.str.extract('(\d+\.?\d*)', expand=False)
提取整数代码为:
.str.extract('(\d+)', expand=False)
读取某列信息,且仅保留数字
# 读取这一列中的信息,保留数字 def numOnly(col_names): for col_name in col_names: b[col_name] = b[col_name].str.extract('(\d+)', expand=False) index_start = b.columns.get_loc("血小板计数") index_end = b.columns.get_loc("谷丙转氨酶") for column_index in range(index_start,index_end+1): b.iloc[:,column_index] = b.iloc[:,column_index].str.extract('(\d+\.?\d*)', expand=False) index_start = b.columns.get_loc("手术_出血量ml") index_end = b.columns.get_loc("详情_Apgar评分(高)") for column_index in range(index_start,index_end+1): b.iloc[:,column_index] = b.iloc[:,column_index].str.extract('(\d+\.?\d*)', expand=False) return True
python 表inner内连接后,行数多于之前
原因:有重复的表连接字段
修改:
c.drop_duplicates(subset=["就诊标识(医渡云计算)"], keep='last',inplace=True) c.shape
解决:
完美!!
完善
Python数据处理的小技巧
Python是一种强大的编程语言,非常适合数据处理和分析任务。
在这篇博客中,我们将分享一些Python数据处理中的小技巧,这些技巧可以帮助更高效地处理数据。
1. 使用列表解析进行数据转换
列表解析是一种精炼的方式来处理列表中的元素,它可以在一行代码中完成许多操作,如映射、筛选和转换。以下是一个示例,将一个列表中的所有元素加倍:
original_list = [1, 2, 3, 4, 5] doubled_list = [x * 2 for x in original_list] print(doubled_list)
2. 使用collections.Counter
统计元素出现次数
collections.Counter
是一个强大的工具,用于统计可迭代对象中元素的出现次数。以下是一个示例,统计字符串中字符出现的次数:
from collections import Counter text = "Hello, World!" char_count = Counter(text) print(char_count)
3. 使用zip
函数同时迭代多个列表
zip
函数允许您同时迭代多个列表,这对于处理多个相关的列表非常有用。以下是一个示例,同时迭代两个列表:
names = ["Alice", "Bob", "Charlie"] scores = [85, 92, 78] for name, score in zip(names, scores): print(f"{name}: {score}")
4. 使用enumerate
获取元素的索引
enumerate
函数允许您获取可迭代对象中元素的索引,这在需要同时访问索引和元素时非常有用。以下是一个示例:
fruits = ["apple", "banana", "cherry"] for index, fruit in enumerate(fruits): print(f"Index {index}: {fruit}")
5. 使用pandas
进行数据分析
pandas
是一个强大的Python库,用于数据处理和分析。它提供了数据结构和函数,可以轻松处理和分析大量数据。以下是一个示例,使用pandas
加载和分析CSV文件:
import pandas as pd data = pd.read_csv('data.csv') print(data.head())
结语
Python提供了丰富的工具和库,可以帮助您更高效地处理数据。在实际工作中,掌握这些技巧以及其他数据处理技术是非常重要的,可以大大提高生产力和分析能力。