Series基本操作

简介: Series基本操作
import pandas as pd
s1 = pd.Series([i for i in range(1,6)])
  • 访问所有的索引
s1.index
RangeIndex(start=0, stop=5, step=1)
  • 访问所有的值
s1.values
array([1, 2, 3, 4, 5])
  • 传入ndarray
s2 = pd.Series(np.arange(10))
s2
0    0
1    1
2    2
3    3
4    4
5    5
6    6
7    7
8    8
9    9
dtype: int64
  • 传入字典
s3 = pd.Series({'1': 1, '2': 2, '3': 3})
s3
1    1
2    2
3    3
dtype: int64
s3.index
Index(['1', '2', '3'], dtype='object')
s3.values
array([1, 2, 3])
  • 指定index
s4 = pd.Series([1, 2, 3, 4], index=['A', 'B', 'C', 'D'])
s4
A    1
B    2
C    3
D    4
dtype: int64
s4.values
array([1, 2, 3, 4])
s4.index
Index(['A', 'B', 'C', 'D'], dtype='object')
  • Series的访问
s4['A']
1
  • Series的筛选
s4[s4>2]
C    3
D    4
dtype: int64
  • 转化为字典
s4.to_dict()
{'A': 1, 'B': 2, 'C': 3, 'D': 4}
# 如果只传入一个字典,则结果Series中的索引就是原字典的键(有序排列)。你可以传入排好序的字典的键以改变顺序:
s5 = pd.Series(s4.to_dict())
s5
A    1
B    2
C    3
D    4
dtype: int64
index_1 = ['A', 'B', 'C','D','E']
s6 = pd.Series(s5, index = index_1)
s6 #由于E这个索引没有对应的值,即为NaN(即“非数字”(not a number),在pandas中,它用于表示缺失或NA值
A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
dtype: float64
  • 我将使用缺失(missing)或NA表示缺失数据。pandas的isnull和notnull函数可用于检测缺失数据:
pd.isnull(s6)
A    False
B    False
C    False
D    False
E     True
dtype: bool
# Series也有类似的实例方法, 面向对象调用
s6.isnull()
A    False
B    False
C    False
D    False
E     True
dtype: bool
pd.notnull(s6)
A     True
B     True
C     True
D     True
E    False
dtype: bool
  • Series对象本身及其索引都有一个name属性,该属性跟pandas其他的关键功能关系非常密切:
s6.name = 'DEMO1'
s6
A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
Name: DEMO1, dtype: float64
s6.index.name = 'demo_index'
s6
demo_index
A    1.0
B    2.0
C    3.0
D    4.0
E    NaN
Name: DEMO1, dtype: float64
  • Series的索引可以通过赋值的方式就地修改:
s6.index
Index(['A', 'B', 'C', 'D', 'E'], dtype='object', name='demo_index')
import string
up_index = [i for i in string.ascii_lowercase[21:26]]
up_index
['v', 'w', 'x', 'y', 'z']
s6.index = up_index
s6
v    1.0
w    2.0
x    3.0
y    4.0
z    NaN
Name: DEMO1, dtype: float64
相关文章
|
18天前
|
存储 数据挖掘 数据处理
掌握Pandas核心数据结构:Series与DataFrame的四种创建方式
本文介绍了 Pandas 库中核心数据结构 Series 和 DataFrame 的四种创建方法,包括从列表、字典、标量和 NumPy 数组创建 Series,以及从字典、列表的列表、NumPy 数组和 Series 字典创建 DataFrame,通过示例详细说明了每种创建方式的具体应用。
115 67
|
4天前
|
存储 数据挖掘 索引
Pandas数据结构:Series与DataFrame
本文介绍了 Python 的 Pandas 库中两种主要数据结构 `Series` 和 ``DataFrame`,从基础概念入手,详细讲解了它们的创建、常见问题及解决方案,包括数据缺失处理、数据类型转换、重复数据删除、数据筛选、排序、聚合和合并等操作。同时,还提供了常见报错及解决方法,帮助读者更好地理解和使用 Pandas 进行数据分析。
35 10
|
7月前
|
SQL 数据采集 数据挖掘
Pandas DataFrame 基本操作实例100个
Pandas DataFrame 基本操作实例100个
236 1
|
7月前
|
存储 数据挖掘 数据处理
Pandas数据结构详解:Series与DataFrame的奥秘
【4月更文挑战第16天】Pandas的Series和DataFrame是数据处理的核心工具。Series是一维标签化数组,支持各种数据类型,可通过索引便捷访问。DataFrame是二维表格型数据结构,适合存储和操作表格数据。两者提供丰富的统计方法和操作,如筛选、排序、分组聚合。它们之间可相互转换和交互,助力高效的数据分析。理解和掌握Series和DataFrame对于数据科学至关重要。
|
SQL 机器学习/深度学习 数据挖掘
pandas数据结构(Series和DataFrame)
无可非议,pandas是Python最强大的数据分析和探索工具之一,因金融数据分析工具而开发,支持类似于SQL语句的模型,可以对数据进行增删改查等操作,支持时间序列分析,也能够灵活的处理缺失的数据。它含有使数据分析工作变得更快更简单的高级数据结构和操作工具。pandas是基于NumPy构建的,让以NumPy为中心的应用变得更加简单。这里所说的让pandas变得更快更简单的高级数据结构就是Series和DataFrame。要熟练使用pandas,首先得要熟悉它的这两个主要的数据结构:Series和DateFrame。
104 0
|
索引 Python
Pandas中Series的属性、方法、常用操作以及使用示例(二)
Pandas中Series的属性、方法、常用操作以及使用示例(二)
|
索引 Python
Pandas中Series的属性、方法、常用操作以及使用示例(一)
Pandas中Series的属性、方法、常用操作以及使用示例
|
索引 Python
Pandas中Series的属性、方法、常用操作以及使用示例(三)
Pandas中Series的属性、方法、常用操作以及使用示例(三)
|
Serverless 索引 Python
如何查看 Series、DataFrame 对象的数据
我们可以使用 head() 和 tail() 方法来查看 Series 对象或 DataFrame 对象的一小部分数据,默认查看的元素个数为 5 个,head() 展示头部的 5 个元素,tail() 展示尾部的 5 个元素,也可以自定义展示的元素个数。当 Series 对象或 DataFrame 对象包含的数据较多时,使用 head() 或 tail() 查看数据的结构会非常方便。
137 0
|
数据挖掘 索引 Python
【Python数据分析 - 12】:Series结构、pandas中值的获取和修改、切片操作与排序(pandas篇)
【Python数据分析 - 12】:Series结构、pandas中值的获取和修改、切片操作与排序(pandas篇)
244 0
【Python数据分析 - 12】:Series结构、pandas中值的获取和修改、切片操作与排序(pandas篇)