scikit-learn 和pandas 基于windows单机机器学习环境的搭建

简介:

很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。

Step 1. Python的安装

    python有2.x和3.x的版本之分,但是很多好的机器学习python库都不支持3.x,因此,推荐安装2.7版本的python。当前最新的python是2.7.12.链接如下:

    https://www.python.org/downloads/release/python-2712/

    里面可以看到有32位版和64位版的。如果你的机器是64位版的,那么32位和64位版的任选一个安装就可以了。如果机器是32位版的,就只能安装32位版的了。如果你搞不清楚你的机器的位数,那么就安装32位版的吧。也就是“Windows x86 MSI installer”。

Windows x86-64 MSI installer Windows for AMD64/EM64T/x64, not Itanium processors 8fa13925db87638aa472a3e794ca4ee3 19820544 SIG
Windows x86 MSI installer Windows   fe0ef5b8fd02722f32f7284324934f9d 18907136 SIG

     安装完毕后,可以设置下环境变量,把python目录加到PATH,比如我的Python装在 C:\Python27,那我就把C:\Python27\Scripts和C:\Python27加到环境变量。当然不加也可以。这样每次使用Python时加上python的全路径名。

    安装完成后,在windows的命令行输入python,如果能出来python的基本信息说明安装成功。

Step 2. Python包管理工具pip的安装

    我们需要包管理工具来方便python库的安装,包管理工具有很多,这里推荐我习惯使用的pip。

    下载pip的安装脚本。链接如下。下载get-pip.py。然后到你的下载目录,在命令行输入"python get-pip.py",跑完即可安装成功。

    https://pip.pypa.io/en/stable/installing/

    下载完毕后,记得跑下这个命令“pip install -U pip”,一是看看pip能不能正常工作,二是把pip升级到最新版本。

Step 3. 安装 Visual C++ Compiler for Python

    链接在这: https://www.microsoft.com/en-us/download/details.aspx?id=44266

    这个不装后面很多科学计算的都会装不了。

Step 4. 安装numpy和scipy

    这两哥们是科学计算和矩阵运算必备工具。

    由于numpy和scipy直接用pip安装经常会出各种各样的问题,因此一般推荐下载离线版的whl来安装numpy和scipy。

    首先安装离线版的numpy,这里我一般是在下面的链接下载numpy,当然scipy也是在这。

    http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy

    可以看到里面有很多版本的numpy可以下载,我们的python是2.7,windows 32位的,因此下载“numpy-1.11.2+mkl-cp27-cp27m-win32.whl

    下载完毕后进入下载目录,在命令行运行 "pip install numpy-1.11.2+mkl-cp27-cp27m-win32.whl" ,这样numpy就安装成功了。

    用同样的方法安装scipy。在下面的链接下载scipy。

    http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

    我们的python是2.7,windows 32位的,因此选择scipy-0.18.1-cp27-cp27m-win32.whl下载。

    完了运行 "pip install scipy-0.18.1-cp27-cp27m-win32.whl"

    这样numpy和scipy两个好基友就搞定了。

Step 4. 安装matplotlib,pandas和scikit-learn

    这没有什么好说的,直接在命令行运行下面的命令即可。注意,先安装matplotlib再安装pandas

    pip install -U matplotlib

     

    pip install -U jinja2

    pip install -U jsonschema

    pip install -U pyzmq

    pip install -U pandas

 

    pip install -scikit-learn

Step 5. 安装ipython和ipython notebook

    ipython notebook是最常用的python交互式学习工具,当然,现在叫做Jupyter Notebook。scikit-learn官方的例子都给出了用ipython notebook运行的版本。

    安装方式很简单:

    pip install ipython

    pip install jupyter

    官网在这:http://ipython.org/notebook.html

    安装完毕后,在命令行输入“jupyter-notebook”,输出会提示你notebook运行在http://localhost:8888

Step 6.  Hello World!尝试运行一个scikit-learn机器学习程序

 

    在scikit-learn官网下载一个机器学习的例子,比如: http://scikit-learn.org/stable/_downloads/plot_cv_predict.ipynb

    然后在下载目录运行"jupyter notebook",接着浏览器打开http://localhost:8888

    可以在浏览器看到你下载目录的内容,我们打开刚下载的plot_cv_predict.ipynb这个文件链接,可以看到python程序的内容,这时我们可以点上面的三角形按钮,一步步的运行程序,如果没有报错,最后可以看到一个线性回归的预测图。

    可以修改这个程序,重新一步步的跑,达到研究学习的目的。

    以上就是scikit-learn和pandas环境的搭建过程。希望大家都可以搭建成功,来研究机器学习。

本文转自刘建平Pinard博客园博客,原文链接:http://www.cnblogs.com/pinard/p/6013484.html,如需转载请自行联系原作者


相关文章
|
1月前
|
Java 开发工具 Windows
Windows环境下面启动jar包,输出的日志出现乱码的解决办法
Windows环境下面启动jar包,输出的日志出现乱码的解决办法
|
1月前
|
数据采集 机器学习/深度学习 Python
【机器学习】数据清洗——基于Pandas库的方法删除重复点
【机器学习】数据清洗——基于Pandas库的方法删除重复点
52 1
|
1月前
|
Unix 编译器 开发者
Qt5.14.2 轻松掌握Qt中的压缩与解压缩:QuaZIP的神秘面纱与实战演练之windows环境编译
Qt5.14.2 轻松掌握Qt中的压缩与解压缩:QuaZIP的神秘面纱与实战演练之windows环境编译
|
2天前
|
5G Python
Windows11搭建Python环境(Anaconda安装与使用)
Windows11搭建Python环境(Anaconda安装与使用)
14 0
|
8天前
|
机器学习/深度学习 算法 数据处理
构建自定义机器学习模型:Scikit-learn的高级应用
【4月更文挑战第17天】本文探讨了如何利用Scikit-learn构建自定义机器学习模型,包括创建自定义估计器、使用管道集成数据处理和模型、深化特征工程以及调优与评估模型。通过继承`BaseEstimator`和相关Mixin类,用户可实现自定义算法。管道允许串联多个步骤,而特征工程涉及多项式特征和自定义变换。模型调优可借助交叉验证和参数搜索工具。掌握这些高级技巧能提升机器学习项目的效果和效率。
|
16天前
|
机器学习/深度学习 人工智能 算法
机器学习基础:使用Python和Scikit-learn入门
【4月更文挑战第9天】本文介绍了使用Python和Scikit-learn进行机器学习的基础知识和入门实践。首先,简述了机器学习的基本概念和类型。接着,展示了如何安装Python和Scikit-learn,加载与处理数据,选择模型进行训练,以及评估模型性能。通过本文,读者可了解机器学习入门步骤,并借助Python和Scikit-learn开始实践。
|
1月前
|
存储 JavaScript 开发工具
Windows 10环境下Git安装之简易指南
该指南教小白在Windows 10上安装Git,介绍Git设置的基础知识,为你的开发项目做准备!
|
2月前
|
机器学习/深度学习 数据采集 自然语言处理
编写员工聊天监控软件的机器学习模块:Scikit-learn在行为分析中的应用
随着企业对员工行为监控的需求增加,开发一种能够自动分析员工聊天内容并检测异常行为的软件变得愈发重要。本文介绍了如何使用机器学习模块Scikit-learn来构建这样一个模块,并将其嵌入到员工聊天监控软件中。
165 3
|
2月前
|
Windows 网络安全
Windows【工具 05】使用freeSSHd搭建sftp环境(安装+配置+避坑)freeSSHd version 1.3.1安装包网盘分享
【2月更文挑战第2天】使用freeSSHd搭建sftp环境(安装+配置+避坑)freeSSHd version 1.3.1安装包网盘分享
431 0
Windows【工具 05】使用freeSSHd搭建sftp环境(安装+配置+避坑)freeSSHd version 1.3.1安装包网盘分享
|
2月前
|
消息中间件 Kafka Apache
【Kafka专栏】windows搭建Kafka环境 & 详细教程(01)
【Kafka专栏】windows搭建Kafka环境 & 详细教程(01)