Python数据分析开发环境Anaconda

简介: Anaconda就是可以便捷获取包且对包能够进行管理,包括了python和很多常见的软件库和一个包管理器conda。常见的科学计算类的库都包含在里面了,使得安装比常规python安装要容易,同时对环境可以统一管理的发行版本。 Anaconda是专注于数据分析的Python发行版本,包含了conda、Python等190多个科学包及其依赖项

数据分析标准环境Anaconda

在这里插入图片描述

1、Anaconda介绍

1.1概述

Anaconda就是可以便捷获取包且对包能够进行管理,包括了 python和很多常见的软件库和一个包管理器 conda。常见的科学计算类的库都包含在里面了,使得安装比常规 python安装要容易,同时对环境可以统一管理的发行版本。

Anaconda是专注于数据分析的Python发行版本,包含了condaPython等190多个科学包及其依赖项

1.2 特点

  • 开源
  • 安装过程简单
  • 高性能使用PythonR语言
  • 免费的社区支持

1.3了解Anaconda

  首先我们需要从 python本身说起,从根源寻找问题,我们在使用p ython语言编写程序之前需要下载一个 python解释器,这才是 python的本体,没了 python解释器,我们即使写了无比正确优雅的 python脚本也没办法运行,那这个解释器在哪呢?就在你安装 python的地方。

所有的第三方包都放在site-packages文件夹里面。最关键的,一个python环境中需要有一个解释器,和一个包集合

解释器:解释器根据python的版本大概分为23python23之间无法互相兼容,也就是说用python2语法写出来的脚本不一定能在python3的解释器中运行。

包集合:包集合中包含了自带的包和第三方包,第三方包我们一般通过pip或者easy_install来下载,当一个python环境中不包含这个包,那么引用了这个包的程序不能在该python环境中运行。

python环境解释完了,那么接下来就要说明这样的环境究竟产生哪些问题,因为anaconda正式为了解决这些问题而诞生的。

  1. 到底该装 Python2 呢还是 Python3
   python2python3在语法上是不兼容的,那我的机器上应该装 python2还是 python3呢,可能一开始选一个学习就好了,但是如果你要开发的程序必须使用 python2而不能使用 python3,那这时候你就不得不再下载一个 python2,那这时候环境变量该设谁的目录呢,如果还是切换环境变量岂不是很麻烦。
虽然目前 Python3使用的范围更广,但是 Python3小版本之前也存在一些差异
  1. 包管理
  如果我在本地只有一个python环境那我所有程序用到的各种包都只能放到同一个环境中,导致环境混乱。另外当我将写好的程序放到另一电脑上运行时又会遇到缺少相关包,需要自己手动一个个下载的情况实在是烦人。要是能每个程序开发都选用不同的环境,而开发好之后又能将该程序需要的环境(第三方包)都独立打包出来就好了

1.4anaconda与virtualenv的对比

  • anaconda
是一个包含180+的科学包及其依赖项的发行版本。可以创建一个独立的Python环境,其包含的科学包包括: conda, numpy, scipy, ipython,notebook
  • virtualenv
用于创建一个独立的Python环境的工具,新环境中需要手动安装需要的三方包

1.5pip与conda比较

依赖项检查

  • pip
不一定会展示所需其他依赖包
安装包时或许会直接忽略依赖项而安装,仅在结果中提示错误
  • conda
列出所需其他依赖包
安装包时自动安装其依赖项
可以便捷地在包的不同版本中自由切换

环境管理

  • pip
维护多个环境难度较大
  • conda
比较方便地在不同环境之间进行切换,环境管理较为简单

对系统自带Python的影响

  • pip
在系统自带 Python中包的更新/回退版本/卸载将影响其他程序
  • conda
不会影响系统自带 Python

适用语言

  • pip
仅适用于 Python
  • conda
适用于 Python, R, Ruby, Lua, Scala, Java, JavaScript, C/C++, FORTRAN
conda结合了 pipvirtualenv的功能

2、Anaconda安装

  • windows(参考图片流程)

1.单击Next

在这里插入图片描述

2.点击I Agree

在这里插入图片描述

3.All Users

在这里插入图片描述

4.更改安装路径

在这里插入图片描述

5.点击Install 安装

在这里插入图片描述

6.安装好点击下一步

在这里插入图片描述

7.继续下一步

在这里插入图片描述

8.点击完成

在这里插入图片描述

9.现在就

在这里插入图片描述

3、管理环境

Windows用户请打开Anaconda Prompt,macOS和Linux用户请打开“终端”进行操作。

3.1 创建新环境

命令:conda create --name <env_name> <package_names>

说明:默认情况下,新创建的环境将会被保存在 /Users/<user_name>/anaconda3/env目录下。其中, <user_name>为当前用户的用户名。
  • env_name:即创建的环境名,建议以英文命名,且不加空格,名称两边不加尖括号< >
  • package_names:即安装在环境中的包名,名称两边不加尖括号< >
如果要安装指定的版本号,则只需要在包名后面以 =和版本号的形式执行。如: conda create --name env1 python=2.7,即创建一个名为"python2"的环境,环境中安装版本为2.7的python。

如果要在新创建的环境中创建多个包,则直接在<package_names>后以空格隔开,添加多个包名即可。如:conda create --name env2 python=3.7 numpy pandas,即创建一个名为"python3"的环境,环境中安装版本为3.7的python,同时也安装了numpy和pandas

  • --name:可以替换为-n

3.2 切换环境

Linux&macOS:conda activate <env_name>

windows:activate <env_name>

说明:

如果创建环境后安装 Python时没有指定 Python的版本,那么将会安装与 Anaconda版本相同的 Python版本,即如果安装 Anaconda第2版,则会自动安装 Python 2.x;如果安装 Anaconda第3版,则会自动安装 Python 3.x

当成功切换环境之后,在该行行首将以(env_name)[env_name]开头。其中,env_name为切换到的环境名。

3.3 退出环境至物理环境

Linux&macOS:conda deactivate

windows:deactivate

3.4 显示已创建环境

conda info --envsconda info -econda env list

3.5 复制环境

命令:conda create --name <new_env_name> --clone <copied_env_name>

copied_env_name:即为被复制/克隆环境名,环境名两边不加尖括号< >

new_env_name:即为复制之后新环境的名称,环境名两边不加尖括号< >

3.6 删除环境

命令:conda remove --name <env_name> --all

4、包管理

4.1 获取当前环境中已安装的包信息

conda list

4.2查找可供安装的包版本

  • 精确查找

    命令:conda search --full-name <package_full_name>

    --full-name:为精确查找的参数

    <package_full_name>:是被查找包的全名。包名两边不加尖括号“<>”

  • 模糊查找

    命令:conda search <text>

    <text>:是查找含有“此字段”的包名。此字段两边不加尖括号“<>”

4.3 安装包

  • 在当前环境中安装包

conda install <package_name>

  • 指定版本号

conda install <package_name>=version

  • 在指定环境中安装包

conda install --name <env_name> <package_name>

  • 使用pip安装包

pip install <package_name>

说明:当使用 conda install无法进行安装时,可以使用 pip进行安装。

注意:

  • pip只是包管理器,无法对环境进行管理。因此如果想在指定环境中使用pip进行安装包,则需要先切换到指定环境中,再使用pip命令安装包。
  • pip无法更新python,因为pip并不将python视为包。
  • pip可以安装一些conda无法安装的包;conda也可以安装一些pip无法安装的包。因此当使用一种命令无法安装包时,可以尝试用另一种命令。
  • Anaconda.org安装包
说明:当使用 conda install无法进行安装时,可以考虑从 Anaconda.org中获取安装包的命令,并进行安装,浏览器中输入 http://anaconda.org(无需注册)。

4.4 卸载包

  • 卸载当前环境中的包

conda remove <package_name>

  • 卸载指定环境中的包

conda remove --name <env_name> <package_name>

4.5 更新包

  • 更新指定包

conda update <package_name>conda upgrade <package_name>

说明:更新多个指定包,则包名以空格隔开,向后排列。
例如: conda update pandas numpy matplotlib即更新 pandasnumpymatplotlib包。
  • 更新所有包

conda update --allconda upgrade --all

说明:在安装 Anaconda之后执行上述命令更新 Anaconda中的所有包至最新版本,便于使用。

相关文章
|
23天前
|
数据采集 存储 数据挖掘
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第27天】在数据分析领域,Python的Pandas库因其强大的数据处理能力而备受青睐。本文介绍了Pandas在数据导入、清洗、转换、聚合、时间序列分析和数据合并等方面的高效技巧,帮助数据分析师快速处理复杂数据集,提高工作效率。
55 0
|
8天前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第42天】本文将介绍如何使用Python进行数据分析和可视化。我们将从数据导入、清洗、探索性分析、建模预测,以及结果的可视化展示等方面展开讲解。通过这篇文章,你将了解到Python在数据处理和分析中的强大功能,以及如何利用这些工具来提升你的工作效率。
|
17天前
|
机器学习/深度学习 数据采集 数据挖掘
解锁 Python 数据分析新境界:Pandas 与 NumPy 高级技巧深度剖析
Pandas 和 NumPy 是 Python 中不可或缺的数据处理和分析工具。本文通过实际案例深入剖析了 Pandas 的数据清洗、NumPy 的数组运算、结合两者进行数据分析和特征工程,以及 Pandas 的时间序列处理功能。这些高级技巧能够帮助我们更高效、准确地处理和分析数据,为决策提供支持。
35 2
|
24天前
|
存储 数据挖掘 数据处理
Python数据分析:Pandas库的高效数据处理技巧
【10月更文挑战第26天】Python 是数据分析领域的热门语言,Pandas 库以其高效的数据处理功能成为数据科学家的利器。本文介绍 Pandas 在数据读取、筛选、分组、转换和合并等方面的高效技巧,并通过示例代码展示其实际应用。
31 2
|
29天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
30 2
|
7天前
|
数据采集 数据可视化 数据挖掘
掌握Python数据分析,解锁数据驱动的决策能力
掌握Python数据分析,解锁数据驱动的决策能力
|
15天前
|
并行计算 数据挖掘 大数据
Python数据分析实战:利用Pandas处理大数据集
Python数据分析实战:利用Pandas处理大数据集
|
15天前
|
数据采集 数据可视化 数据挖掘
利用Python进行数据分析:Pandas库实战指南
利用Python进行数据分析:Pandas库实战指南
|
17天前
|
SQL 数据挖掘 Python
数据分析编程:SQL,Python or SPL?
数据分析编程用什么,SQL、python or SPL?话不多说,直接上代码,对比明显,明眼人一看就明了:本案例涵盖五个数据分析任务:1) 计算用户会话次数;2) 球员连续得分分析;3) 连续三天活跃用户数统计;4) 新用户次日留存率计算;5) 股价涨跌幅分析。每个任务基于相应数据表进行处理和计算。
|
17天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析和可视化
【10月更文挑战第33天】本文将介绍如何使用Python编程语言进行数据分析和可视化。我们将从数据清洗开始,然后进行数据探索性分析,最后使用matplotlib和seaborn库进行数据可视化。通过阅读本文,你将学会如何运用Python进行数据处理和可视化展示。
下一篇
无影云桌面