一:Python数据分析基础
Anaconda IDE的基本使用方法
1. Anaconda是一个集成各类Python工具的集成平台
2. 包管理和环境管理工具:conda
conda: 一个工具,用于包管理和环境管理,其中:
- 包管理与pip类似,管理Python第三方库
- 环境管理能够允许用户使用不同版本Python,并能灵活切换
anaconda:一个集合,包括conda、某版本Python、一批第三方库等
conda将工具、第三方库、Python版本、conda都当作包,同等对待
3. 编程工具:Spyder
4. 交互式编程环境:IPython
二:Python数据分析表示
NumPy库入门
1.NumPy
NumPy是一个开源的Python科学计算基础库,包含:
- 一个强大的N维数组对象 ndarray
- 广播功能函数
- 整合C/C++/Fortran代码的工具
-线性代数、傅里叶变换、随机数生成等功能
NumPy是SciPy、Pandas等数据处理或科学计算库的基础
2.N维数组对象:ndarray
ndarray是一个多维数组对象,由两部分构成:
- 实际的数据
- 描述这些数据的元数据(数据维度、数据类型等)
ndarray数组一般要求所有元素类型相同(同质),数组下标从0开始
3.ndarray的元素类型
ndarray为什么要支持这么多种元素类型? 对比:Python语法仅支持整数、浮点数和复数 3种类型
- 科学计算涉及数据较多,对存储和性能都有较高要求
- 对元素类型精细定义,有助于NumPy合理使用存储空间并优化性能
- 对元素类型精细定义,有助于程序员对程序规模有合理评估
4.ndarray数组的创建
5.ndarray数组的变换
6.ndarray数组的操作
数组的索引和切片
索引:获取数组中特定位置元素的过程
切片:获取数组元素子集的过程
Python数据分析与展示2:https://developer.aliyun.com/article/1395295