手把手教你从零搭建Python数据分析环境

简介:

由于最近再做推荐系统的特征处理,需要借助一些工具来筛选特征。最初使用了R,R的安装很简单,而且API也很容易使用,直接就能出图。后来,发现很多人在python和R之间做选择,所以我也在两个工具间摇摆不定。后来,发现Tensorflow里面有很多python的代码,而且python可以做爬虫写web,几乎是万金油的角色。本着想找一门以后日常使用的工具的心态,最终还是选择了python。

那么本篇就从下面几个方面介绍下,如何在日常使用python做数据分析:

  • python安装以及numpy、matplotlib的安装
  • python的hello world
  • SublimeText的python集成
  • 相关推荐

希望对那些刚刚打算做数据分析的朋友,提供参考。

Python以及必要的库安装

Python目前有两个版本,一个是2.7,一个是3.4,在同事的推荐下,选择了2.7。Python的下载直接去官网就可以了,但是想要做数据分析,还需要依赖很多其他的模块,比如科学计算库Numpy,图形库matplotlib,数值计算库scipy,数据挖掘分析库pandas,本篇就先安装个Numpy和matplotlib,以做演示,其他库的安装基本类似。

python安装的几种方式

  • 一种是在sourceforge上下载exe文件,只要操作系统版本没问题,几乎是一键安装
  • 一种是下载zip或者tar.gz压缩包,使用里面的setup.py执行setup.py install命令安装
  • 另一种是下载whl文件,放在python的scripts文件夹中,使用命令pip install xxx.whl安装

我这次由于需要的库比较多,下载的安装文件什么样子都有,所以几种方式都会演示下。

相关的下载资源参考分享链接:链接:http://pan.baidu.com/s/1i4Jhez7 密码:t1sw

安装Python

直接运行python-2.7.13.amd64.msi,无脑下一步即可,不过要记住python所在的目录C:\Python27\,稍后需要对这个目录进行添加文件。

安装numpy和matplotlib

如果版本没问题(比如不是64位系统下载安装32位软件),那么会自动识别到python所在的目录,直接下一步安装即可。

Matplotlib也是一样安装即可。

安装cycler、dateutil

把whl文件拷贝到python27/scripts目录下,可以暂时忽略requests那个文件,这个requests库是webhdfs库连接hdfs环境用的,如果不使用可以用安装

然后分别执行命令:

pip install cycler-0.10.0-py2.py3-none-any.whl
pip install python_dateutil-2.6.1-py2.py3-none-any.whl

安装pyparsing

解压pyparsing压缩包,在setup.py那层目录执行setup.py install命令安装即可

安装到这里,numpy和matplotlib就可以使用了~

python初体验

python安装完,来体验一下吧。python支持控制台输出,也支持在新的文件中写入多行内容,统一执行。

SublimeText集成

直接使用IDLE,有点太麻烦,直接基于sublime text开发过ruby和web前端,体验非常好,所以还是想通过sublimeText编写python代码。

因此首先在点击Tools->Build System->New Build System,弹出文件:
{
"shell_cmd": "make"
}

按照下面的配置输入:
{
"cmd": ["C:/Python27/python.exe", "-u", "$file"],
"file_regex": "^[ ]File "(…?)", line ([0-9]*)",
"selector": "source.python"
}
并保存成自己的名字(我起名叫做my_python),注意路径需要修改为本地的python路径。路径为C:\Users\xxh\AppData\Roaming\Sublime Text 3\Packages\User

在Tools -> Build System 中重新选择my_pyhton

然后再SublimeText中体验一下matplotlib的魅力,代码如下:

import numpy as np
import matplotlib.pyplot as plt
plt.figure(1)
ax1=plt.subplot(211)
x=np.linspace(0,100,100)
for i in xrange(1,100):
    plt.figure(1)
    plt.plot(x,x*2)
plt.show()

按ctrl+B即可执行:

相关推荐

1 廖雪峰的python教程:http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/
2 runoob的python教程:http://www.runoob.com/python/python-tutorial.html

本文转自博客园xingoo的博客,原文链接:手把手教你从零搭建Python数据分析环境,如需转载请自行联系原博主。
相关文章
|
3月前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析的入门指南
本文将引导读者了解如何使用Python进行数据分析,从安装必要的库到执行基础的数据操作和可视化。通过本文的学习,你将能够开始自己的数据分析之旅,并掌握如何利用Python来揭示数据背后的故事。
|
4月前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析的入门指南
【10月更文挑战第42天】本文是一篇技术性文章,旨在为初学者提供一份关于如何使用Python进行数据分析的入门指南。我们将从安装必要的工具开始,然后逐步介绍如何导入数据、处理数据、进行数据可视化以及建立预测模型。本文的目标是帮助读者理解数据分析的基本步骤和方法,并通过实际的代码示例来加深理解。
103 3
|
2月前
|
Shell Linux Ruby
Python3虚拟环境venv
`venv` 是 Python 的虚拟环境工具,用于为不同项目创建独立的运行环境,避免依赖冲突。通过 `python3 -m venv` 命令创建虚拟环境,并使用 `source bin/activate` 激活。激活后,所有 Python 包将安装在该环境中,不影响系统全局环境。退出环境使用 `deactivate` 命令。每个虚拟环境拥有独立的包集合,确保项目间的隔离性。删除虚拟环境只需删除其目录即可。
93 34
|
11天前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
本书介绍了如何将Python与Excel结合使用,以提升数据分析和处理效率。内容涵盖Python入门、pandas库的使用、通过Python包操作Excel文件以及使用xlwings对Excel进行编程。书中详细讲解了Anaconda、Visual Studio Code和Jupyter笔记本等开发工具,并探讨了NumPy、DataFrame和Series等数据结构的应用。此外,还介绍了多个Python包(如OpenPyXL、XlsxWriter等)用于在无需安装Excel的情况下读写Excel文件,帮助用户实现自动化任务和数据处理。
|
2月前
|
SQL 分布式计算 数据处理
云产品评测|分布式Python计算服务MaxFrame | 在本地环境中使用MaxFrame + 基于MaxFrame实现大语言模型数据处理
本文基于官方文档,介绍了由浅入深的两个部分实操测试,包括在本地环境中使用MaxFrame & 基于MaxFrame实现大语言模型数据处理,对步骤有详细说明。体验下来对MaxCompute的感受是很不错的,值得尝试并使用!
65 1
|
2月前
|
Shell 程序员 开发者
轻松搞定在Python中构建虚拟环境
本教程教你如何使用业界公认的最佳实践,创建一个完全工作的Python开发环境。虚拟环境通过隔离依赖项,避免项目间的冲突,并允许你轻松管理包版本。我们将使用Python 3的内置`venv`模块来创建和激活虚拟环境,确保不同项目能独立运行,不会相互干扰。此外,还将介绍如何检查Python版本、激活和停用虚拟环境,以及使用`requirements.txt`文件共享依赖项。 通过本教程,你将学会: - 创建和管理虚拟环境 - 避免依赖性冲突 - 部署Python应用到服务器 适合新手和希望提升开发环境管理能力的开发者。
135 2
|
2月前
|
Python
探索Python虚拟环境:virtualenv、venv与pipenv比较
在Python开发中,有效的环境管理至关重要。virtualenv、venv和pipenv是常用的虚拟环境管理工具。virtualenv支持Python 2.7+和3.3+,可创建独立环境;venv为Python 3.3+内置库,简单轻量但功能有限;pipenv则结合了包管理和虚拟环境管理,生成Pipfile.lock确保依赖确定性和安全性,推荐作为首选工具。
111 2
|
2月前
|
人工智能 编译器 Python
python已经安装有其他用途如何用hbuilerx配置环境-附带实例demo-python开发入门之hbuilderx编译器如何配置python环境—hbuilderx配置python环境优雅草央千澈
python已经安装有其他用途如何用hbuilerx配置环境-附带实例demo-python开发入门之hbuilderx编译器如何配置python环境—hbuilderx配置python环境优雅草央千澈
48 0
python已经安装有其他用途如何用hbuilerx配置环境-附带实例demo-python开发入门之hbuilderx编译器如何配置python环境—hbuilderx配置python环境优雅草央千澈
|
3月前
|
机器学习/深度学习 Rust 算法
Python环境管理的新选择:UV和Pixi,高性能Python环境管理方案
近期Python生态系统在包管理领域发生了重要变化,Anaconda调整商业许可证政策,促使社区寻找更开放的解决方案。本文介绍两款新一代Python包管理工具:UV和Pixi。UV用Rust编写,提供高性能依赖解析和项目级环境管理;Pixi基于Conda生态系统,支持conda-forge和PyPI包管理。两者分别适用于高性能需求和深度学习项目,为开发者提供了更多选择。
414 2
|
4月前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
232 4
数据分析的 10 个最佳 Python 库

热门文章

最新文章