python数据分析工具安装集合-阿里云开发者社区

开发者社区> 王小雷> 正文

python数据分析工具安装集合

简介: 用python做数据分析离不开几个好的轮子(或称为科学棧/第三方包等),比如matplotlib,numpy, scipy, pandas, scikit-learn, gensim等,这些包的功能强大,丰富,包括含了绘图,机器学习,爬虫,数据分析等等。而开发工具推荐使用pycharm或者Jupyter notebook(ipython notebook)。开发起来的样子是这
+关注继续查看

用python做数据分析离不开几个好的轮子(或称为科学棧/第三方包等),比如matplotlib,numpy, scipy, pandas, scikit-learn, gensim等,这些包的功能强大,丰富,包括含了绘图,机器学习,爬虫,数据分析等等。而开发工具推荐使用pycharm或者Jupyter notebook(ipython notebook)。开发起来的样子是这样的。
此方法,同时适用于windows和linux(也许mac也行,没实践过)。我的环境是ubuntu16.04,64位,python2.7.12,python3.5.1+。不过,这次的记录安装方式跟系统关系不大,linux和windows实践方式相同,只不过,windows用户打开CMD后,输入的命令不带sudo,也不需要另行安装pip(windows自带)

1.安装Jupyter notebook(或者安装pycharm直接下载安装皆可,linux和windows同样适用)

#如果是ubuntu16.04 默认已经安装了python2和python3
#需要另行安装pip,python2的pip安装
sudo apt-get python-pip

#如果安装python3的pip
sudo apt-get python3-pip
#安装开发工具Jupyter notebook
sudo pip3 install jupyter

注意,只能安装一个jupyter notebook,默认只能包含一个内核,如python3或者python2,请根据自己开发需求。
特殊需求:
需要python3和python2共存的,请看我另几篇文章。Windows下Python多版本共存

2.在线安装(windows/linux)主要的数据分析工具(轮子)

注意:Ubuntn中,默认的pip 是指python2的,pip3才是python3的,如果安装python3的轮子,请将pip替换成pip3,反之亦然。
数据分析(为了避免依赖冲突,请按顺序安装)

sudo pip3 install numpy
sudo pip3 install pandas
#安装matplotlib需要先安装libpng和freetype
sudo apt-get install libpng-dev
#如果不知到需要下载工具的全称,可以用来查找需要工具的关键词sudo apt search freetype
sudo apt-get install libfreetype6-dev
sudo pip3 install matplotlib
sudo pip3 install scipy
#文本处理工具
sudo pip3 install gensim
#机器学习
sudo pip3 install scikit-learn

安装完成某个轮子之后,应该是这样的
这里写图片描述

以此方法安装,随着知识领域的扩展和经验的增加,我们会发现更多更有趣的轮子。

查看已经安装的轮子

pip3 list

这里写图片描述

3.离线安装(windows/linux)数据分析工具(轮子)

直接在上述网址下载对应的.whl(虽然本网址http://www.lfd.uci.edu/~gohlke/pythonlibs/只有win的= =,但是方法适合任何平台,离线包可以去官网下载,如https://pypi.python.org/pypi/scipy/)
pip3 install 下载的本地路径/numpy-1.11.1+mkl-cp35-cp35m-win_amd64.whl
pip3 install 下载的本地路径/numpy-1.11.1-cp27-cp27mu-manylinux1_x86_64.whl

4.主要的大数据分析轮子介绍

博主比较懒,已经存在的介绍就不赘述了,直接上送包下载地址,且该地址对包有了大意的介绍。
送上python包地址http://www.lfd.uci.edu/~gohlke/pythonlibs/

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
QT编写图片数据转换工具
学习QT已经一个月了,觉得QT真是个好东西,他的这种跨平台机制简直太棒了!还有QML这东西,真牛B!在这段学习期间,因为一个项目的需要,需要将图片转成数据,然后传出去,那边接收到数据后再对应转换成图片,才有了下面这个小工具,开发环境:QT 4.7.0,在LINUX下面重新编译也可以在LINUX下面运行,代码不用改!先放张截图吧。
758 0
ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生
ML之FE:基于load_mock_customer数据集(模拟客户,单个DataFrame)利用featuretools工具实现自动特征生成/特征衍生
20 0
Python数据持久化-小测验
2018年7月13日考试 1.Python读写csv文件 现有如下图1所示的data.csv文件数据,请使用python读取该csv文件数据,并添加一条记录后输出如图2所示的output.
1094 0
Linux内核分析(一)---linux体系简介|内核源码简介|内核配置编译安装
原文:Linux内核分析(一)---linux体系简介|内核源码简介|内核配置编译安装 Linux内核分析(一) 从本篇博文开始我将对linux内核进行学习和分析,整个过程必将十分艰辛,但我会坚持到底,同时在博文中如果那些地方有问题还请各位大神为我讲解。
1314 0
Python数据结构之集合概览
Python数据结构之集合概览集合(collection),正如其名称所示,是可以作为概念性的单位来处理的一组零个或多个项。几乎软件的每一个重要部分都涉及集合的使用。尽管我们在计算机科学中所学的一些内容已经随着技术的变化逐渐消失,但组织集合的基本原理并没有变化。
8396 0
+关注
王小雷
专注大数据,人工智能的多面手,对新兴的技术与知识充满了好奇与渴望!
128
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载