Python 教程之 Pandas(13)—— series 上的转换操作

简介: Python 教程之 Pandas(13)—— series 上的转换操作

series 上的转换操作

在转换操作中,我们执行各种操作,例如更改系列的数据类型,将系列更改为列表等。为了执行转换操作,我们有各种有助于转换的功能,例如.astype().tolist()

代码#1:

# 使用 astype 转换 series 数据类型的 Python 程序
# importing pandas module  
import pandas as pd 
# 从 url 读取 csv 文件  
data = pd.read_csv("nba.csv") 
# 删除空值列以避免错误
data.dropna(inplace = True) 
# 在转换之前存储 dtype
before = data.dtypes 
# 使用 astype 转换 dtypes
data["Salary"]= data["Salary"].astype(int) 
data["Number"]= data["Number"].astype(str) 
# 转换后存储 dtype
after = data.dtypes 
# 打印出来比较
print("BEFORE CONVERSION\n", before, "\n") 
print("AFTER CONVERSION\n", after, "\n")

输出:

image.png


代码 #2:

# Python程序将 series 转换为列表
# 导入 pandas 模块  
import pandas as pd  
# 导入 regex 模块 
import re 
# 制作数据框 
data = pd.read_csv("nba.csv")  
# 删除空值以避免错误
data.dropna(inplace = True)  
# 操作前存储 dtype
dtype_before = type(data["Salary"]) 
# 转换为列表
salary_list = data["Salary"].tolist() 
# 操作后存储dtype
dtype_after = type(salary_list) 
# 打印数据类型
print("Data type before converting = {}\nData type after converting = {}"
      .format(dtype_before, dtype_after)) 
# 显示列表
salary_list

输出 :

image.png

Pandas series 方法:

功能 描述
Series() 可以使用 Series() 构造函数方法创建熊猫系列。此构造方法接受各种输入
combine_first() 方法用于将两个系列合二为一
count() 返回系列中非 NA/null 观测值的数量
size() 返回基础数据中的元素数
name() 方法允许为 Series 对象(即列)命名
is_unique() 如果对象中的值是唯一的,则方法返回布尔值
idxmax() 提取Series中最高值的索引位置的方法
idxmin() 提取系列中最低值的索引位置的方法
sort_values() 在 Series 上调用方法以按升序或降序对值进行排序
sort_index() 在熊猫系列上调用方法以按索引而不是其值对其进行排序
head() 方法用于从系列的开头返回指定数量的行。该方法返回一个全新的系列
tail() 方法用于从 Series 的末尾返回指定数量的行。该方法返回一个全新的系列
le() 用于将 Caller 系列的每个元素与传递的系列进行比较。对于每个小于或等于传递系列中的元素的元素,它返回 True
ne() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个不等于传递系列中的元素的元素返回 True
ge() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为大于或等于传递系列中的元素的每个元素返回 True
eq() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个等于传递系列中的元素的元素返回 True
gt() 用于比较两个系列并为每个元素返回布尔值
lt() 用于比较两个系列并为每个元素返回布尔值
clip() 用于剪裁低于和高于传递的最小和最大值的值
clip_lower() 用于裁剪低于传递的最小值的值
clip_upper() 用于剪裁高于传递的最大值的值
astype() 方法用于更改系列的数据类型
tolist() 方法用于将系列转换为列表
get() 在 Series 上调用方法以从 Series 中提取值。这是传统括号语法的替代语法
unique() Pandas unique() 用于查看特定列中的唯一值
nunique() Pandas nunique() 用于获取唯一值的计数
value_counts() 计算每个唯一值在系列中出现的次数的方法
factorize() 方法通过识别不同的值来帮助获得数组的数字表示
map() 将一个对象的值绑定到另一个对象的方法
between() Pandas between() 方法用于系列检查哪些值位于第一个和第二个参数之间
apply() 调用方法并将 Python 函数作为参数提供给每个 Series 值使用该函数。此方法有助于执行 pandas 或 numpy 中未包含的自定义操作


目录
相关文章
|
3月前
|
Java 数据处理 索引
(Pandas)Python做数据处理必选框架之一!(二):附带案例分析;刨析DataFrame结构和其属性;学会访问具体元素;判断元素是否存在;元素求和、求标准值、方差、去重、删除、排序...
DataFrame结构 每一列都属于Series类型,不同列之间数据类型可以不一样,但同一列的值类型必须一致。 DataFrame拥有一个总的 idx记录列,该列记录了每一行的索引 在DataFrame中,若列之间的元素个数不匹配,且使用Series填充时,在DataFrame里空值会显示为NaN;当列之间元素个数不匹配,并且不使用Series填充,会报错。在指定了index 属性显示情况下,会按照index的位置进行排序,默认是 [0,1,2,3,...] 从0索引开始正序排序行。
317 0
|
3月前
|
Java 数据挖掘 数据处理
(Pandas)Python做数据处理必选框架之一!(一):介绍Pandas中的两个数据结构;刨析Series:如何访问数据;数据去重、取众数、总和、标准差、方差、平均值等;判断缺失值、获取索引...
Pandas 是一个开源的数据分析和数据处理库,它是基于 Python 编程语言的。 Pandas 提供了易于使用的数据结构和数据分析工具,特别适用于处理结构化数据,如表格型数据(类似于Excel表格)。 Pandas 是数据科学和分析领域中常用的工具之一,它使得用户能够轻松地从各种数据源中导入数据,并对数据进行高效的操作和分析。 Pandas 主要引入了两种新的数据结构:Series 和 DataFrame。
485 0
|
4月前
|
数据采集 存储 XML
Python爬虫技术:从基础到实战的完整教程
最后强调: 父母法律法规限制下进行网络抓取活动; 不得侵犯他人版权隐私利益; 同时也要注意个人安全防止泄露敏感信息.
799 19
|
3月前
|
索引 Python
Python 列表切片赋值教程:掌握 “移花接木” 式列表修改技巧
本文通过生动的“嫁接”比喻,讲解Python列表切片赋值操作。切片可修改原列表内容,实现头部、尾部或中间元素替换,支持不等长赋值,灵活实现列表结构更新。
156 1
|
4月前
|
数据采集 存储 JSON
使用Python获取1688商品详情的教程
本教程介绍如何使用Python爬取1688商品详情信息,涵盖环境配置、代码编写、数据处理及合法合规注意事项,助你快速掌握商品数据抓取与保存技巧。
|
5月前
|
存储 数据采集 数据处理
Pandas与NumPy:Python数据处理的双剑合璧
Pandas与NumPy是Python数据科学的核心工具。NumPy以高效的多维数组支持数值计算,适用于大规模矩阵运算;Pandas则提供灵活的DataFrame结构,擅长处理表格型数据与缺失值。二者在性能与功能上各具优势,协同构建现代数据分析的技术基石。
456 0
|
5月前
|
并行计算 算法 Java
Python3解释器深度解析与实战教程:从源码到性能优化的全路径探索
Python解释器不止CPython,还包括PyPy、MicroPython、GraalVM等,各具特色,适用于不同场景。本文深入解析Python解释器的工作原理、内存管理机制、GIL限制及其优化策略,并介绍性能调优工具链及未来发展方向,助力开发者提升Python应用性能。
350 0
|
5月前
|
数据采集 索引 Python
Python Slice函数使用教程 - 详解与示例 | Python切片操作指南
Python中的`slice()`函数用于创建切片对象,以便对序列(如列表、字符串、元组)进行高效切片操作。它支持指定起始索引、结束索引和步长,提升代码可读性和灵活性。
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
352 1

推荐镜像

更多