🌟🌟Pandas三种数据类型
Pandas提供了三种数据类型,分别是
Series
、DataFrame
和Panel
。Series用于保存一维数据,DataFrame用于保存二维数据,Panel用于保存三维数据或者可变维数据。平时的表格处理数据分析最常用的数据类型是Series
和DataFrame
,Panel较少用到。
✨✨Series数据结构
Series本质上是一个含有索引的
一维数组
,其包含一个左侧自动生成的index和右侧的values值,分别使用s.index
和s.values
进行查看。
下面举个例子:
下面我们导入数据:
import pandas as pd s=pd.read_excel("D:\A_data\Data_Series.xlsx") s
运行结果如下:
其中,左侧这一列就是索引列,下面我们分别打印s.index和s.values
index返回一个index对象,而values返回一个array。
✨✨ DataFrame数据结构
DataFrame(数据框)类似于Excel电子表格,也与R语言中DataFrame的数据结构类似。
🌙🌙DataFrame数据的选取
🌕🌕DataFrame的构建
import pandas as pd df=pd.DataFrame({'x':['a','b','c'],'y':[1,2,3],'z':[4,5,6]}) df
🌕🌕选取多行
方法一:
df.iloc[[0,1],:]
df.iloc[[0,2],:]
方法二:
df.loc[['0','2'],:]
🌕🌕选取某一列
df.y df['y'] df.loc[:,['y']] df.iloc[:,[1]]
🌕🌕选取多列
方法一:
df.iloc[:,[1,2]]
方法二:
df.loc[:,['x','y']]
方法三:
df[['x','y']]