Python 教程之 Pandas(13)—— series 上的转换操作

简介: Python 教程之 Pandas(13)—— series 上的转换操作

series 上的转换操作

在转换操作中,我们执行各种操作,例如更改系列的数据类型,将系列更改为列表等。为了执行转换操作,我们有各种有助于转换的功能,例如.astype().tolist()

代码#1:

# 使用 astype 转换 series 数据类型的 Python 程序
# importing pandas module  
import pandas as pd 
# 从 url 读取 csv 文件  
data = pd.read_csv("nba.csv") 
# 删除空值列以避免错误
data.dropna(inplace = True) 
# 在转换之前存储 dtype
before = data.dtypes 
# 使用 astype 转换 dtypes
data["Salary"]= data["Salary"].astype(int) 
data["Number"]= data["Number"].astype(str) 
# 转换后存储 dtype
after = data.dtypes 
# 打印出来比较
print("BEFORE CONVERSION\n", before, "\n") 
print("AFTER CONVERSION\n", after, "\n")

输出:

image.png


代码 #2:

# Python程序将 series 转换为列表
# 导入 pandas 模块  
import pandas as pd  
# 导入 regex 模块 
import re 
# 制作数据框 
data = pd.read_csv("nba.csv")  
# 删除空值以避免错误
data.dropna(inplace = True)  
# 操作前存储 dtype
dtype_before = type(data["Salary"]) 
# 转换为列表
salary_list = data["Salary"].tolist() 
# 操作后存储dtype
dtype_after = type(salary_list) 
# 打印数据类型
print("Data type before converting = {}\nData type after converting = {}"
      .format(dtype_before, dtype_after)) 
# 显示列表
salary_list

输出 :

image.png

Pandas series 方法:

功能 描述
Series() 可以使用 Series() 构造函数方法创建熊猫系列。此构造方法接受各种输入
combine_first() 方法用于将两个系列合二为一
count() 返回系列中非 NA/null 观测值的数量
size() 返回基础数据中的元素数
name() 方法允许为 Series 对象(即列)命名
is_unique() 如果对象中的值是唯一的,则方法返回布尔值
idxmax() 提取Series中最高值的索引位置的方法
idxmin() 提取系列中最低值的索引位置的方法
sort_values() 在 Series 上调用方法以按升序或降序对值进行排序
sort_index() 在熊猫系列上调用方法以按索引而不是其值对其进行排序
head() 方法用于从系列的开头返回指定数量的行。该方法返回一个全新的系列
tail() 方法用于从 Series 的末尾返回指定数量的行。该方法返回一个全新的系列
le() 用于将 Caller 系列的每个元素与传递的系列进行比较。对于每个小于或等于传递系列中的元素的元素,它返回 True
ne() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个不等于传递系列中的元素的元素返回 True
ge() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为大于或等于传递系列中的元素的每个元素返回 True
eq() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个等于传递系列中的元素的元素返回 True
gt() 用于比较两个系列并为每个元素返回布尔值
lt() 用于比较两个系列并为每个元素返回布尔值
clip() 用于剪裁低于和高于传递的最小和最大值的值
clip_lower() 用于裁剪低于传递的最小值的值
clip_upper() 用于剪裁高于传递的最大值的值
astype() 方法用于更改系列的数据类型
tolist() 方法用于将系列转换为列表
get() 在 Series 上调用方法以从 Series 中提取值。这是传统括号语法的替代语法
unique() Pandas unique() 用于查看特定列中的唯一值
nunique() Pandas nunique() 用于获取唯一值的计数
value_counts() 计算每个唯一值在系列中出现的次数的方法
factorize() 方法通过识别不同的值来帮助获得数组的数字表示
map() 将一个对象的值绑定到另一个对象的方法
between() Pandas between() 方法用于系列检查哪些值位于第一个和第二个参数之间
apply() 调用方法并将 Python 函数作为参数提供给每个 Series 值使用该函数。此方法有助于执行 pandas 或 numpy 中未包含的自定义操作


目录
相关文章
|
3天前
|
数据可视化 DataX Python
Seaborn 教程-绘图函数
Seaborn 教程-绘图函数
30 8
|
3天前
Seaborn 教程-主题(Theme)
Seaborn 教程-主题(Theme)
21 7
|
3天前
|
Python
Seaborn 教程-模板(Context)
Seaborn 教程-模板(Context)
22 4
|
3天前
|
数据可视化 Python
Seaborn 教程
Seaborn 教程
20 5
|
26天前
|
Python
SciPy 教程 之 Scipy 显著性检验 9
SciPy 教程之 Scipy 显著性检验第9部分,介绍了显著性检验的基本概念、作用及原理,通过样本信息判断假设是否成立。着重讲解了使用scipy.stats模块进行显著性检验的方法,包括正态性检验中的偏度和峰度计算,以及如何利用normaltest()函数评估数据是否符合正态分布。示例代码展示了如何计算一组随机数的偏度和峰度。
24 1
|
26天前
|
BI Python
SciPy 教程 之 Scipy 显著性检验 8
本教程介绍SciPy中显著性检验的应用,包括如何利用scipy.stats模块进行显著性检验,以判断样本与总体假设间的差异是否显著。通过示例代码展示了如何使用describe()函数获取数组的统计描述信息,如观测次数、最小最大值、均值、方差等。
27 1
|
27天前
|
数据采集 数据可视化 数据处理
Python数据科学:Pandas库入门与实践
Python数据科学:Pandas库入门与实践
|
1月前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
71 0
|
3月前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
98 0
|
1月前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
41 2