开发者学堂课程【Python 常用数据科学库:数值运算】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/546/detail/7481
数值运算
内容介绍
一、数值运算操作
二、二元统计
一、数值运算操作
In [1]:import pandas as pd
df = pd. DataFrame ([[1, 2,3], [4, 3, 6]], index = ['a', 'b'], co]umns = ['A', 'B', 'C'])
df
//1 2 3 4 5 6分别是样本
//先将特征拿到手,index 相当于有了数据索引
//指定一些值做一些求和计算(按列)
In [2]: df.sum()
Out[2]: A 5
B 7
C 9
dtype: int64
//指定一些值做一些求和计算(按行)
In [3]: df.sum(axis = 0)
Out[3]: A 5
B 7
C 9
dtype: int64
In [4]: df.sum(axis = 1)
Out[4]: a 6
b 15
dtype: int64
In [5]: df.sum(axis ='columns')
Out [5]: a 6
b 15
dtype: int64
//均值
In [6]:df. mean ()
Out[6]: A 2.5
B 3.5
C 4.5
dtype: float64
In [7]: df. mean (axis = 1)
Out [7]: a 2.0
b 5.0
dtype: float64
//最大值 最小值
In [8]:df.min()
df. max()
Out[8]: A 4
B 5
C 6
dtype: int64
//中位数
In [9]:df. median()
Out[9]:A 2.5
B 3.5
C 4.5
dtype: float64
二、二元统计
In [20]: df = pd.read_csv('./data/titanic.csv')
df.head()
In [21]:df.cov()
//返回特征和特征之间的协方差
//相关差和相关系数
In [22]:df.corr()
//计算每个年龄段都有多少人,采用降序来排
In [23]: df['Age'].value_counts()
//计算每个年龄段都有多少人,采用升序来排
In [24]: df['Age']. value_counts(ascending = True)
In [25]: df['Pclass'].value_counts( ascending = True)
//帮忙做一个分组工作
In [26]: df['Age']. value_counts (ascending = True,bins = 5)
//可以清楚的看出每一个组有多少人
In [27]: df['Age'].count()
In [28]: df['Pclass'].count()
//可以看出来每一组的样本