开发者学堂课程【Python 数据分析库 Pandas 快速入门:索引操作】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/607/detail/8851
索引操作
内容介绍
一、读取文件
二、删除一些列
三、索引操作
一、读取文件
data=pd.read_csv(“./stock_day/stock_day.csv”)
二、删除一些列,让数据更简单,再去做后面的操作
data=data.drop([“ma5”,”ma10”,”ma20”,”v_ma5”,”v_ma10”,”v_ma20”],axis=1)
三、索引操作
Numpy 当中已经讲过使用索引选取序列和切片选择,pandas也支持类似的操作,也可以直接使用列名、行名称,甚至组合使用。
1.直接使用行列索引(先列后行)
获取'2018-02-27'这天的'close"的结果
# 直接使用行列索引名字的方式(先列后行)
Data['open']['2018-02-27' ]
23.53
# 不支持的操作
# 错误
Data['2018-02-27'][‘open’]
#错误
data[:1, :2]
2.按名字索引(loc)
获取从'2018-02-27':'2018-02-22','open'的结果
# 使用 loc:只能指定行列索引的名字
data.loc['2018-02-27':‘2018-02-22',‘open']
2018-02-27 23.53
2018-02-26 22.80
2018-02-23 22.88
Name: open, dtype: float64
3.按数字索引(iloc)
#使用 iloc 可以通过索引的下标去获取
获取前108天数据的‘open'列的结果
data.1loc[0:100, 0:2].head()
open high close low
2018-02-27 23.53 25.88 24.16 23.53
2018-02-26 22.80 23.78 2-.44 22.80
4.组合索引(名字索引和数字索引混用)
使用 ix 组合索引
Warning:Starting in 0,20.0, the .1x indexer is deprecated, in favor of the more strict .iloc and .loc indexers.
获取行第1天到第4天,['open','close','high','low']这个四个指标的结果
#使用 ix 进行下表和名称組合做引
data.ix[0:4, ['open', 'close', 'high', 'low']]
#推荐使用 loc 和 iloc 来获取的方式 一
data.loc[data.index[0:4,['open','close',‘high','low']]
data.iloc[0:4, data.columns.get_indexer(['open', 'close', ‘high', 'low'])]
open close high low
2018-02-27 23.53 24.16 25.88 23.53
2018-02-26 22.80 23.53 23.78 22.80
2018-02-23 22.88 22.82 23.37 22.71
2018-02-22 22,25 22.28 22.76 22.02