开发者学堂课程【Python 常用数据科学库:Pandas 索引】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/546/detail/7479
Pandas 索引
内容介绍
一、Pandas 索引结构
二、bool 类型的索引
一、Pandas 索引结构
//首先把 pandas 导进来,之后读取数据
In [1]: import pandas as pd
df = pd. read_csv('./data/titanic. csv')
//定位到一个列
In [3]:df['Age'] [:5]
//定位到两个列,可以写一个列的名字
In [5]:df[['Age','Fare']][:5]
1、loc 用 label 来去定位
iloc 用 position 来去定位
//拿出前五个数据,接下来定位到某一个数据,df[0] 是出不来的
In [13]:df.iloc[0:5]
//对前五列数据进行筛选,得到想得到的数列
In [14]: df.iloc[0:5,1:3]
//指定一个人的名字,就可以找出数据,设置一个 index 值,用一个人的名字
In [15]: df = df. set_index('Name')
In [17]: df. loc['Heikkinen, Miss. Laina']
//用 loc 定位
In [18]: df.loc['Heikkinen, Miss. Laina','Fare']
//想要所有的列,将其写成索引的形式
In [19]: df. loc['Heikkinen, Miss. Laina':'Allen, Mr. William Henry',:]
//直接进行赋值操作,只要能找到这个数据,就能给这个数据赋值
In [20]: df.loc['Heikkinen, Miss. Laina','Fare'] = 1000
df.head()
//要被遗弃了,别用了
In [21]: df.ix['Heikkinen, Miss. Laina','Fare']
二、bool 类型的索引
//会出现 true 或 false 类型的 bool 值
In [23]: df['Fare'] > 40
//这样出现的就是大于40的值
In [26]: df[df['Fare'] > 40][:5]
//用 bool 数据做索引,比如在选择数据的时候,可以指定 male,取前五个。
In [28]: df[df['Sex'] == 'male'][:5]
In [29]: df.loc[df['Sex'] == 'male','Age'].mean()
//统计计数,统计不同数据,满足要求。比如,一般查看年龄大于70的有多少个。
In [30]: (df['Age'] > 70
).sum()