01 机器学习 - Python基础回顾(一)(上)

简介: 01 机器学习 - Python基础回顾(一)

在学习机器学习的内容之前,下面来快速回顾下Python。

1.Python简介

Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。

Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。

  • Python是一种解释型语言: 这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。
  • Python是交互式语言: 这意味着,您可以在一个Python提示符,直接互动执行写你的程序。
  • Python是面向对象语言: 这意味着Python支持面向对象的风格或代码封装在对象的编程技术。
  • Python是初学者的语言:Python 对初级程序员而言,是一种伟大的语言,它支持广泛的应用程序开发,从简单的文字处理到WWW浏览器再到游戏。

2.Python集成环境

Python已经被移植在许多平台上(经过改动使它能够工作在不同平台上)。

可以直接下载相应平台的二进制代码,然后安装Python,或者使用C编译器手动编译源代码。编译的源代码,功能上有更多的选择性,为python安装提供了更多的灵活性。

以下为不同平台上安装Python的方法:

1、Unix & Linux 平台安装 Python:

打开WEB浏览器访问http://www.python.org/download/

选择适用于Unix/Linux的源码压缩包。

下载及解压压缩包。

如果你需要自定义一些选项修改Modules/Setup

执行 ./configure 脚本

make
make install

执行以上操作后,Python会安装在 /usr/local/bin目录中,Python库安装在/usr/local/lib/pythonXXXX为你使用的Python的版本号。

2、Window 平台安装 Python:

打开WEB浏览器访问http://www.python.org/download/

在下载列表中选择Window平台安装包,包格式为:python-XYZ.msi 文件 , XYZ 为你要安装的版本号。

下载后,双击下载包,进入Python安装向导,安装非常简单,你只需要使用默认的设置一直点击"下一步"直到安装完成即可。

3、环境变量配置

程序和可执行文件可以在许多目录,而这些路径很可能不在操作系统提供可执行文件的搜索路径中。

path(路径)存储在环境变量中,这是由操作系统维护的一个命名的字符串。这些变量包含可用的命令行解释器和其他程序的信息。

Unix或Windows中路径变量为PATH(UNIX区分大小写,Windows不区分大小写)。

vi /etc/profile
export PATH="$PATH:/usr/local/bin/python"

在 Windows 设置环境变量

在环境变量中添加Python目录:

在命令提示框中(cmd) : 输入

path %path%;C:\Python , 按下"Enter"。

注意: C:\Python 是Python的安装目录。

Python 环境变量

下面几个重要的环境变量,它应用于Python:

变量名 描述

PYTHONPATH PYTHONPATH是Python搜索路径,默认我们import的模块都会从PYTHONPATH里面寻找。

PYTHONSTARTUP Python启动后,先寻找PYTHONSTARTUP环境变量,然后执行此文件中变量指定的执行代码。

PYTHONCASEOK加入PYTHONCASEOK的环境变量, 就会使python导入模块的时候不区分大小写.

PYTHONHOME另一种模块搜索路径。它通常内嵌于的PYTHONSTARTUP或PYTHONPATH目录中,使得两个模块库更容易切换。

4、运行Python

有三种方式可以运行Python:

(一)交互式解释器:

你可以通过命令行窗口进入python并开在交互式解释器中开始编写Python代码。

你可以在Unix,DOS或任何其他提供了命令行或者shell的系统进行python编码工作。

$python # Unix/Linux

或者

C:>python # Windows/DOS

以下为Python命令行参数:

选项 描述

-d 在解析时显示调试信息

-O 生成优化代码 ( .pyo 文件 )

-S 启动时不引入查找Python路径的位置

-v 输出Python版本号

-X 从 1.6版本之后基于内建的异常(仅仅用于字符串)已过时。

-c cmd 执行 Python 脚本,并将运行结果作为 cmd 字符串。

file 在给定的python文件执行python脚本。

(二)命令行脚本

在你的应用程序中通过引入解释器可以在命令行中执行Python脚本,如下所示:

#在 Unix/Linux下

$python script.py

在Windows下

C:>python script.py

注意:在执行脚本时,请检查脚本是否有可执行权限。

(三)集成开发环境(IDE:Integrated Development Environment)

您可以使用图形用户界面(GUI)环境来编写及运行Python代码。以下推荐各个平台上使用的IDE:

Linux: IDLE 是 Linux上最早的 Python IDE。

Windows: Pycharm 是jetbrain出品的Python 集成开发环境

3.Python基础语法

3.1 行和缩进

Python中,不使用括号来表示代码的类和函数定义块或流程控制。

代码块是由行缩进,缩进位的数目是可变的,但是在块中的所有语句必须缩进相同的量。

如下所示:

if True:
    print "True"
else:
  print "False"

然而,在本实施例中的第二块将产生一个错误:

if True:
    print "Answer"
    print "True"
else:
    print "Answer"
  print "False"
3.2 Python引号

Python接受单引号(’),双引号(“)和三(’'或”“”)引用,以表示字符串常量,只要是同一类型的引号开始和结束的字符串。

三重引号可以用于跨越多个行的字符串。例如,所有下列是合法的:

word = 'word'
sentence = "This is a sentence."
paragraph = """This is a paragraph. It is
made up of multiple lines and sentences."""
3.3 Python注释

“#”号之后字符和到物理行是注释的一部分,Python解释器会忽略它们。

#!/usr/bin/python
# First comment
print "Hello, Python!";  # second comment
这将产生以下结果:
Hello, Python!
注释可能会在声明中表达或同一行之后:
name = "Madisetti" # This is again comment
你可以使用多行注释如下:
# This is a comment.
# This is a comment, too.
# This is a comment, too.
# I said that already.
3.4 分号的使用

python中一个语句的结束不需要使用分号

如果想在一行中输入多个语句,可使用分号:

import sys; x = 'foo'; sys.stdout.write(x+"""
""")

4.Python的p变量与集合

Python有五个标准的数据类型:

  1. 数字
  2. 字符串
  3. 列表
  4. 元组
  5. 字典

python中定义变量时不需要显示指定变量类型,以下为python中变量使用的典型语法:

4.1 变量定义和赋值
#基本使用
counter = 100          # 整型
miles   = 1000.0       # 浮点
name    = "John"      # 字符串
print counter
print miles
print name
#多重赋值
a = b = c = 1
d, e, f = 1, 2, "john"
4.2 字符串的使用
str = 'Hello World!'
print str         # 打印整个字符串
print str[0]       # 打印字符串第一个字母
print str[2:5]     # 打印第3到第5个字母
print str[2:]      # 打印从第3个字母到末尾
print str * 2      # 字符串重复2次
print str + "TEST"  # 字符串拼接
目录
相关文章
|
6天前
|
机器学习/深度学习 算法 数据挖掘
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧1
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
24 5
|
6天前
|
机器学习/深度学习 并行计算 大数据
【Python篇】深入挖掘 Pandas:机器学习数据处理的高级技巧
【Python篇】深入挖掘 Pandas:机器学习数据处理的高级技巧
34 3
|
6天前
|
机器学习/深度学习 数据采集 分布式计算
【Python篇】深入机器学习核心:XGBoost 从入门到实战
【Python篇】深入机器学习核心:XGBoost 从入门到实战
27 3
|
6天前
|
机器学习/深度学习 数据采集 算法
【Python篇】从零到精通:全面分析Scikit-Learn在机器学习中的绝妙应用
【Python篇】从零到精通:全面分析Scikit-Learn在机器学习中的绝妙应用
21 2
|
6天前
|
机器学习/深度学习 算法 数据可视化
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧2
【Python篇】深度探索NumPy(下篇):从科学计算到机器学习的高效实战技巧
14 1
|
23天前
|
机器学习/深度学习 算法 数据挖掘
Python数据分析革命:Scikit-learn库,让机器学习模型训练与评估变得简单高效!
在数据驱动时代,Python 以强大的生态系统成为数据科学的首选语言,而 Scikit-learn 则因简洁的 API 和广泛的支持脱颖而出。本文将指导你使用 Scikit-learn 进行机器学习模型的训练与评估。首先通过 `pip install scikit-learn` 安装库,然后利用内置数据集进行数据准备,选择合适的模型(如逻辑回归),并通过交叉验证评估其性能。最终,使用模型对新数据进行预测,简化整个流程。无论你是新手还是专家,Scikit-learn 都能助你一臂之力。
78 8
|
20天前
|
机器学习/深度学习 数据可视化 数据挖掘
数据可视化大不同!Python数据分析与机器学习中的Matplotlib、Seaborn应用新视角!
在数据科学与机器学习领域,数据可视化是理解数据和优化模型的关键。Python凭借其强大的可视化库Matplotlib和Seaborn成为首选语言。本文通过分析一份包含房屋面积、卧室数量等特征及售价的数据集,展示了如何使用Matplotlib绘制散点图,揭示房屋面积与售价的正相关关系;并利用Seaborn的pairplot探索多变量间的关系。在机器学习建模阶段,通过随机森林模型展示特征重要性的可视化,帮助优化模型。这两个库在数据分析与建模中展现出广泛的应用价值。
30 2
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【Python机器学习】文本特征提取及文本向量化讲解和实战(图文解释 附源码)
【Python机器学习】文本特征提取及文本向量化讲解和实战(图文解释 附源码)
349 0
|
5月前
|
机器学习/深度学习 算法 数据挖掘
【Python机器学习】K-Means对文本聚类和半环形数据聚类实战(附源码和数据集)
【Python机器学习】K-Means对文本聚类和半环形数据聚类实战(附源码和数据集)
158 0
|
1月前
|
机器学习/深度学习 算法 Python
决策树下的智慧果实:Python机器学习实战,轻松摘取数据洞察的果实
【9月更文挑战第7天】当我们身处数据海洋,如何提炼出有价值的洞察?决策树作为一种直观且强大的机器学习算法,宛如智慧之树,引领我们在繁复的数据中找到答案。通过Python的scikit-learn库,我们可以轻松实现决策树模型,对数据进行分类或回归分析。本教程将带领大家从零开始,通过实际案例掌握决策树的原理与应用,探索数据中的秘密。
39 1