Pandas之Series(一)

简介: Pandas之Series(一)

Pandas简介:

  • Pandas是一种基于Python语言的快速、强大、灵活且易于使用的开源数据分析和数据操作工具。
  • pandas使用Data Frame来存储多列的数据集,使用Series存储单列数据集。
  • Data Frame是二维的数据表,有行有列。Data Frame可以说是由一组Series组成的。

Series:

  • Series有标记(lable)
  • Series的每个值有顺序(order,索引位置)
  • 可以通过标记和位置来引用Series里面的值
  • Series是带有标记的同质数据的一维数组

 

Series简介

Series是pandas里面的类,所以需要先引用pandas:

import pandas as pd

创建Series类·的实例

pd.Series()

这其实相当于一个构造函数,可以添加参数。(比如列表,元组,字典等)

为Series填充值

参数为列表(list)

import pandas as pd
ls=["周一","周二","周三","周四","周五"]
print(pd.Series(ls))

运行结果如下:

由此,我们可以看到第一列,即”0 1 2 3 4“就是索引。我们没有指定index,所以使用默认索引。在Series中,默认索引是从0开始的数字,指定索引后才有所改变。

设置索引(index)

import pandas as pd
ls=["周一","周二","周三","周四","周五"]
serial=[1,2,3,4,5]
print(pd.Series(data=ls,index=serial))

运行结果如下:

其他类型的例子

整型:

1. lucky_numbers={4,8,15,16,23,42}
2. print(pd.Series(lucky_numbers))

浮点型:

stock_prices={985.32,950.44}
time_of_day={"Open","Close"}
print(pd.Series(data=stock_prices,index=time_of_day))

bool类型

bunch_of_bools={True,False,False}
print(pd.Series(bunch_of_bools))

构造函数强制类型转换

(dtype:数据类型)

lucky_numbers={4,8,15,16,23,42}
print(pd.Series(data=lucky_numbers,dtype="float"))
import pandas as pd
import numpy as  np
temperatures={94,88,np.nan,91}
print(pd.Series(data=temperatures))

(注意:dtype是float64)

当含有nan值时,pandas会自动把数值的类型转化为浮点型,目的是保持类型的一致。

从其他Python类型创建Series:

从字典(Dictionary创建Series)

import pandas as pd
persons={"张三":185,"李四":177,"王二麻子":181.4}  #key与value
print(pd.Series(persons))

运行结果如下:

这时key就作为lable,values还是字典中的values。

从元组(tuple)创建Series

import pandas as pd
color=("Red","Green","Blue")
print(pd.Series(data=color))

这时的索引仍然是默认的:

注意:不能使用set(集合),因为它是无序的。

从Numpy的ndarray

rd=np.random.randint(1,101,10)#创建1~100之间的10个随机数
print(rd)
print(pd.Series(rd))

Series的属性

1.values属性

 

import pandas as pd
color=("Red","Green","Blue")
s=pd.Series(color)
print(s.values)

运行结果如下:

['Red','Green','Blue']

其属性为

nump.ndarray

2.index属性

import pandas as pd
color=("Red","Green","Blue")
s=pd.Series(color)
print(s.index)

运行结果为:

RangeIndex(start=0,start=3,step=1)

其属性为:

pandas.core.indexes.base.Index

3.dtype属性

import pandas as pd
color=("Red","Green","Blue")
s=pd.Series(color)
print(s.dtype)

运行结果为:

object

4.size属性

返回values的个数

print(s.size)
3

5.shape属性:

返回一个元组(由于Series是一维的,所以只返回一个数)

print(s.shape)
(3,)

6.is_unique属性

若Series里面有相同的,则返回False。若没有,则返回Ture

print(s.is_unique)
Ture

获取前几行和后几行

d=range(0,500,5) #生成一个序列
ns=pd.Series(data=d)
print(ns)

取前n个数需要用到函数head()。

如果没有传递参数,那么默认为5。(不同编译系统可能不同)

import pandas as pd
d=range(0,500,5)
ns=pd.Series(data=d)
print(ns)
ns_2=ns.head(5)
print(ns_2)
ns_3=ns.head(10)
print(ns_3)

获取后几行,利用函数tail()

1. ns_4=ns.tail(3)
2. ns_5=ns.tail(5)
3. print(ns_4)
4. print(ns_5)

e737faae5fb44bd68ab35e33f0d947ec.png

相关文章
Pandas数据结构:Series与DataFrame
本文介绍了 Python 的 Pandas 库中两种主要数据结构 `Series` 和 ``DataFrame`,从基础概念入手,详细讲解了它们的创建、常见问题及解决方案,包括数据缺失处理、数据类型转换、重复数据删除、数据筛选、排序、聚合和合并等操作。同时,还提供了常见报错及解决方法,帮助读者更好地理解和使用 Pandas 进行数据分析。
298 10
掌握Pandas核心数据结构:Series与DataFrame的四种创建方式
本文介绍了 Pandas 库中核心数据结构 Series 和 DataFrame 的四种创建方法,包括从列表、字典、标量和 NumPy 数组创建 Series,以及从字典、列表的列表、NumPy 数组和 Series 字典创建 DataFrame,通过示例详细说明了每种创建方式的具体应用。
303 67
Pandas Series 和 DataFrame 常用属性详解及实例
Pandas 是 Python 数据分析的重要工具,其核心数据结构 Series 和 DataFrame 广泛应用。本文详细介绍了这两种结构的常用属性,如 `index`、`values`、`dtype` 等,并通过具体示例帮助读者更好地理解和使用这些属性,提升数据分析效率。
98 4
|
5月前
|
Pandas 数据结构 - Series
10月更文挑战第26天
77 2
Pandas 数据结构 - Series
Pandas学习笔记之Series
Pandas学习笔记之Series
Pandas 使用教程 Series、DataFrame
Pandas 使用教程 Series、DataFrame
122 0
Pandas数据结构详解:Series与DataFrame的奥秘
【4月更文挑战第16天】Pandas的Series和DataFrame是数据处理的核心工具。Series是一维标签化数组,支持各种数据类型,可通过索引便捷访问。DataFrame是二维表格型数据结构,适合存储和操作表格数据。两者提供丰富的统计方法和操作,如筛选、排序、分组聚合。它们之间可相互转换和交互,助力高效的数据分析。理解和掌握Series和DataFrame对于数据科学至关重要。
Pandas基本操作:Series和DataFrame(Python)
Pandas基本操作:Series和DataFrame(Python)
380 1
|
11月前
|
Python 教程之 Pandas(13)—— series 上的转换操作
Python 教程之 Pandas(13)—— series 上的转换操作
135 0
Python 教程之 Pandas(13)—— series 上的转换操作

热门文章

最新文章