Pandas 数据结构 Series
Pandas主要有两个数据结构:Series 和 DataFrame。本节主要介绍Series。
Series类似一维数组,由索引和一组数据组成,其中索引在左边,值在右边。
1、定义方式
定义方式 1):
import pandas as pd data = pd.Series([1,2,3,4])
在未指定索引时,会自动创建一个 0 - base 的索引,类似于数据结构中的一维数组。
Series自带的属性 index 和 values可以获取索引和值,实现方式如下:
data.index # 输出为 Int64([0,1,2,3]) data.values # 输出为 array([1,2,3,4])
类似于一维数组,同样可以按照索引进行数据搜索,即:
1. data[0] 2. # 输出 1
定义方式 2):
如果数据以Python字典的形式存储,也可以直接通过字典创建 Series:
1. data = {'name':zhangsan,'age':26, 'job':programmer} 2. obj = pd.Series(data)
2、缺失数据
用缺失或 NA 表示缺失数据。
pandas中可以使用 isnull() 和 notnull() 函数来判断是否缺失,输出结果为 True 和 False,True表示缺失,False表示未缺失。