《python 与数据挖掘 》一 2.3 流程控制

简介:

本节书摘来自华章出版社《python 与数据挖掘 》一书中的第2章,第2.3节,作者张良均 杨海宏 何子健 杨 征,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3 流程控制

流程控制是一门程序语言的基本,掌握Python流程控制语句就已经能够实现很多算法了。本节主要介绍Python的条件分支结构if语句和两种主要循环结构while语句和for语句,并在最后详细讲解Python函数的用法。如果读者有一定的编程基础,对条件分支、循环和函数这3种结构比较熟悉,那么本节的内容是简单的。如果读者初入编程,请认真阅读本节,这些内容是你日后编程的基础。

2.3.1 if语句

如果你的任务是输出两个数a和b之间的较大者,那么你的思路应该是这样的:
如果a大于b:输出a
否则:输出b
如果想通过Python实现上面的思想,就必须借助if语句实现条件分支。在介绍if语句前,我们先来了解布尔表达式的相关内容。
1.布尔表达式
在3.2节中我们简单介绍过布尔值,而布尔表达式是返回一个布尔值(或称为真值)的表达式。首先下面的值作为布尔表达式的时候,会直接返回假(False):
False ,None ,0 , "" , () ,[] , {}
也就是说,标准值False和None,数字0和所有空序列都为False,其余的单个对象都为True。
在表达式运算的过程中,True会视为数值1,False会视为数值0,这与其他编程语言是相似的。逻辑表达式是布尔表达式的一种,逻辑表达式指的是带逻辑操作符或比较操作符(如>,==)的表达式。逻辑表达式返回的是False或者True。代码清单2-2举了一些带True和False的表达式运算的例子:
代码清单2-2 布尔表达式

print "布尔表达式"
print True,False
# result: True,False
print True == 1
# result: True
print True + 2
# result: 3
print True + False*3
# result: 1
print 3 > 2
# result: True
print (1 < 3)*10
# reuslt: 10
*代码详见:示例程序/code/2-3.py

2.条件分支
到目前为止的程序都是一条一条语句顺序执行的,现在我们的程序开始有了选择和判断的能力。if语句能够设置分支,有且只有1条分支会被执行,这和我们日常语言中的“如果”是一样的。if语句的一般格式如下:
if 布尔表达式1:

分支一

elif 布尔表达式2:

分支二

else:

分支三

程序会先计算第一个布尔表达式,如果结果为真,则执行第一个分支的所有语句。如果为假,则计算第二个布尔表达式,如果第二个布尔表达式结果为真,则执行第二个分支的所有语句。如果结果仍然为假,则执行第三个分支的所有语句。如果只有两个分支,那么不需要elif,直接写else即可,如果有更多的分支,那么就需要添加更多的elif语句。Python中没有switch和case语句,多路分支只能通过if-elif-else来实现。注意整个分支结构中是有严格的退格缩进要求的。代码清单2-3给出一些例子。
代码清单2-3 条件分支

print "条件分支"
# 例1    判断天气
weather = 'sunny'
if weather =='sunny':
    print "shopping"
elif weather =='cloudy':
    print "playing football"
else:
    print "learning python"
#result: shopping
# 例2    选择两个数的较大者
import math
a = math.pi
b = math.sqrt(9.5)
if a>b:
    print a
else:
    print b
# result: 3.14159265359
# 例3    3个数简单排序
first = 1
second = 2
third = 3
if second<third:
    t = second
    second = third
    third = t
if first<second:
    t = first
    first = second
    second = t
if second<third:
    t = second
    second = third
    third = t
print first,'>',second,'>',third
# result: 3 > 2 > 1
*代码详见:示例程序/code/2-3.py

2.3.2 while循环

  1. while语句
    计算机比人类愚蠢得多,但计算机的优势是它能够无休止地进行计算。2016年3月谷歌的人工智能机器AlphaGo击败棋力世界排名前十的李世石,这个新闻引起了强大轰动。很多人不理解人工智能为何能够超越人脑。可以这样简单地理解,AlphaGo能够日夜不停地自我对弈,不断提高实力,而且速度比人类快得多,它的胜利是可以预见的。

回归正题,似乎我们现有的知识要让程序重复地做一件事,就只能重复地写相同的代码,显然这不合理。为此,我们需要掌握一个重要的概念——循环。while循环是最常用的循环之一,它的格式如下:
while 布尔表达式:

程序段

只要布尔表达式为真,那么程序段将会被执行,执行完毕后,再次计算布尔表达式,如果结果仍然为真,那么再次执行程序段,直至布尔表达式为假。举一个例子,如果要计算1到1000的和是多少,那么可以:

  a=1000
s=0
while a:
    s+=a
    a-=1
  1. break和continue
    下面看两个简单的语句,它们只有嵌套在循环中才起作用,分别是break语句和continue语句。它们的作用如下:

break:跳出最内层循环。
continue:跳到最内层循环的首行。
简单来说,break用于中止循环,注意,如果一个while语句嵌套在另一个while语句内,即程序中有双层循环,内层循环中的break语句仅仅退出内层循环并回到外层循环。而continue语句是中断当前的循环并回到循环段的开头重新执行程序。首次接触continue的读者可能比较难理解,代码清单2-4举出了一些例子。
代码清单2-4 while语句

print '''while语句'''


# 例1 1到1000求和
a = 1000
s = 0
while a:
    s+=a
    a-=1
print s
#result: 500500

# 例2 简单计算
while True:
    s = input('1+2=')
    if s ==3:
        print '答案正确'
        break
    if s>=0 and s<=9:
        continue
print '答案是个位数'
*代码详见:示例程序/code/2-3.py

2.3.3 for循环

for循环在Python中是一个通用的序列迭代器,可以遍历任何有序的序列。for语句可作用于字符串、列表、元组,这些数据结构在2.4节将会详细介绍,本节我们的例子需要用到这些数据结构。程序语言的学习是一个循环的学习过程,与其他学科不同,程序语言的知识是相互紧扣的。读者阅读本节有困难的话可以先跳到2.4节。

  1. for语句
    Python中的for语句接受可迭代对象,如序列和迭代器作为其参数,每次循环调取其中一个元素。在代码清单2-5中,我们给出了for循环对字符串、列表的遍历。Python的for循环看上去像伪代码,非常简洁,如代码清单2-5所示。

代码清单2-5 for语句

print '''简单for循环'''
# 对列表和字符串进行迭代
for a in ['e','f','g']:
print a,
# result:e f g
print
for a in 'string':
print a,
# result:string
*代码详见:示例程序/code/2-3.py
  1. range()函数
    如果你希望Python能像C语言的格式进行循环,就需要一个数字序列,range()函数能够快速生成一个数字序列。如:

range(5)

[0,1,2,3,4]
那么Python中for i in range(5)的效果和C中for(i=0;i<5;i++)的效果是一样的。而range(a,b)能够返回列表[a,a+1,…,b-1](注意不包含b),这样for循环就可以从任意起点开始,任意终点结束。range()函数经常和len()函数一起用于遍历整个序列。len()函数能够返回一个序列的长度,for i in range(len(L))能够迭代整个列表L。虽然直接使用for循环似乎也可以实现这个目的,但是直接使用for循环难以对序列进行修改(因为每次迭代调取的元素并不是序列元素的引用),而通过range()和len()函数可以快速通过索引访问序列并对其进行修改。请看下面的代码清单2-6:
代码清单2-6 range()函数

print '''range()函数'''
print range(2,9)
# result: [2, 3, 4, 5, 6, 7, 8]
print range(2,9,3)  #相邻元素的间隔为3
# result: [2, 5, 8]

print '-'*70

# 直接使用for循环难以改变序列元素
L = [1,2,3]
for a in L:
    a+=1  #a不是引用,L中对应的元素没有发生改变
print L  
# result: [1,2,3]

# range()与len()函数遍历序列并修改元素
for i in range(len(L)):
    L[i]+=1  #通过索引访问
print L 
# result: [2,3,4]
*代码详见:示例程序/code/2-3.py

3.循环中的else语句
for循环同样支持break和continue语句。循环语句可以有一个else语句,当for循环迭代整个列表后或while循环条件变为假时,循环并非通过break语句终止时,便会执行这个else语句。下面给出一个实现简单搜索质数的例子(见代码清单2-7)。
代码清单2-7 循环中的else语句

print '''循环中的else语句'''
# 简单搜索质数
for n in range(2,10):
    for x in range(2,n):
        if n%x ==0: # 含有非普通因子
print n,'equals',x,'*',n/x
        break
    else:
        print n,'是一个质数' # 仅含有普通因子,说明这是一个质数
*代码详见:示例程序/code/2-3.py
相关文章
|
2月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
使用Python实现深度学习模型:智能数据隐私保护
使用Python实现深度学习模型:智能数据隐私保护 【10月更文挑战第3天】
116 0
|
2月前
|
数据采集 JSON 数据处理
抓取和分析JSON数据:使用Python构建数据处理管道
在大数据时代,电商网站如亚马逊、京东等成为数据采集的重要来源。本文介绍如何使用Python结合代理IP、多线程等技术,高效、隐秘地抓取并处理电商网站的JSON数据。通过爬虫代理服务,模拟真实用户行为,提升抓取效率和稳定性。示例代码展示了如何抓取亚马逊商品信息并进行解析。
抓取和分析JSON数据:使用Python构建数据处理管道
|
26天前
|
图形学 Python
SciPy 空间数据2
凸包(Convex Hull)是计算几何中的概念,指包含给定点集的所有凸集的交集。可以通过 `ConvexHull()` 方法创建凸包。示例代码展示了如何使用 `scipy` 库和 `matplotlib` 绘制给定点集的凸包。
27 1
|
27天前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
27天前
|
数据采集 Web App开发 iOS开发
如何使用 Python 语言的正则表达式进行网页数据的爬取?
使用 Python 进行网页数据爬取的步骤包括:1. 安装必要库(requests、re、bs4);2. 发送 HTTP 请求获取网页内容;3. 使用正则表达式提取数据;4. 数据清洗和处理;5. 循环遍历多个页面。通过这些步骤,可以高效地从网页中提取所需信息。
|
2月前
|
数据处理 Python
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
这篇文章介绍了如何使用Python读取Excel文件中的数据,处理后将其保存为txt、xlsx和csv格式的文件。
56 3
Python实用记录(十):获取excel数据并通过列表的形式保存为txt文档、xlsx文档、csv文档
|
2月前
|
计算机视觉 Python
Python实用记录(九):将不同的图绘制在一起、将不同txt文档中的数据绘制多条折线图
这篇文章介绍了如何使用Python的OpenCV库将多张图片合并为一张图片显示,以及如何使用matplotlib库从不同txt文档中读取数据并绘制多条折线图。
44 3
Python实用记录(九):将不同的图绘制在一起、将不同txt文档中的数据绘制多条折线图
|
2月前
|
数据可视化 算法 Python
基于OpenFOAM和Python的流场动态模态分解:从数据提取到POD-DMD分析
本文介绍了如何利用Python脚本结合动态模态分解(DMD)技术,分析从OpenFOAM模拟中提取的二维切片数据,以深入理解流体动力学现象。通过PyVista库处理VTK格式的模拟数据,进行POD和DMD分析,揭示流场中的主要能量结构及动态特征。此方法为研究复杂流动系统提供了有力工具。
87 2
基于OpenFOAM和Python的流场动态模态分解:从数据提取到POD-DMD分析
|
2月前
|
数据可视化 算法 JavaScript
基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式
本文探讨了如何利用图论分析时间序列数据的平稳性和连通性。通过将时间序列数据转换为图结构,计算片段间的相似性,并构建连通图,可以揭示数据中的隐藏模式。文章介绍了平稳性的概念,提出了基于图的平稳性度量,并展示了图分区在可视化平稳性中的应用。此外,还模拟了不同平稳性和非平稳性程度的信号,分析了图度量的变化,为时间序列数据分析提供了新视角。
61 0
基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式
|
2月前
|
人工智能 IDE 测试技术
使用通义灵码提升Python开发效率:从熟悉代码到实现需求的全流程体验
作为一名Python开发者,我最近开始使用通义灵码作为开发辅助工具。它显著提高了我的工作效率,特别是在理解和修改复杂代码逻辑方面。通过AI编码助手,我能够在短时间内快速上手新项目,实现新需求,并进行代码优化,整体效率提升了60%以上。通义灵码不仅加快了代码生成速度,还增强了代码的健壮性和稳定性。